Baidu Speech Recognition

什么是"Baidu Speech Recognition"？

百度AI开放平台是全球领先的人工智能服务平台，提供语音、图像、NLP等多项人工智能技术。平台开放对话式人工智能系统和智能驾驶系统两大行业生态，帮助用户提升竞争力，开创未来。

"Baidu Speech Recognition"有哪些功能？

1. 语音识别：提供短语音识别、实时语音识别等功能，支持自助训练专属模型，识别准确率高达98%。
2. 文字识别：包括通用文字识别、网络图片文字识别、表格文字识别等功能，支持20种语言，2W+大字库。
3. 人脸识别：提供人脸关键点识别、人脸检测与属性分析、人脸对比等功能，支持离线调用，适配兼容全面。
4. 图像识别：包括通用物体和场景识别、品牌logo识别、植物识别等功能，支持相同图片搜索、相似图片搜索等。
5. 语言与知识：提供情感倾向分析、知识图谱、自然语言处理等功能，帮助用户进行情感分析、知识图谱构建等任务。
6. 视频技术：包括视频编排策略、视频分析等功能，支持高品质发音人和数字人，价格低至1.68元/分钟。

应用场景：

1. 语音识别：可应用于语音导航、语音会议、语音智能工牌系统等场景。
2. 文字识别：可应用于办公文档识别、表格文字识别、财务票据识别等场景。
3. 人脸识别：可应用于人脸闸机、人脸考勤、人脸实名认证等场景。
4. 图像识别：可应用于品牌logo识别、车辆分析、内容安全等场景。
5. 语言与知识：可应用于情感倾向分析、知识图谱构建、智能写作等场景。
6. 视频技术：可应用于视频编排策略、视频分析、智能媒体等场景。