Watson Speech To Text

什么是"Watson Speech To Text"？

IBM Watson Speech to Text是一个语音转文本的API，可以将语音转换为多种语言的文本。它可以作为SaaS提供，也可以自行托管。

"Watson Speech To Text"有哪些功能？

1. 自动语音识别：使用IBM Watson的神经技术，实现语音识别的声音应用程序。
2. 模型训练选项：通过语言和声学训练选项，提高语音识别的准确性。
3. 针对客户服务优化：使用针对客户服务领域调整的语音模型，激活您的语音应用程序。
4. 预训练的语音模型：使用针对客户服务领域调整的语音模型，激活您的语音应用程序。
5. 微调功能：通过提取短语、单词、字母、数字或列表，提高语音识别的准确性。
6. 低延迟转录：使用针对实时语音应用程序优化的模型，实现低延迟的转录。
7. 转录前的音频诊断：在转录开始之前，分析和纠正弱音频信号。
8. 最终结果之前的临时转录：通过使用生成的语音转录以及最终化过程中的语音转录，提高应用程序的响应时间。
9. 智能格式化：将日期、时间、数字、货币值、电子邮件和网站地址转录为常规形式，以便在最终转录中使用。
10. 说话人分辨率：识别多方参与者之间的发言人。目前针对两方呼叫中心对话进行了优化，但可以检测多达6个不同的发言人。
11. 关键词识别和过滤：使用关键词识别和亵渎词过滤功能，过滤特定词汇或不适当内容。（仅限美式英语）

应用场景：

1. 客户自助服务：使用基于Watson的虚拟助手在电话中回答常见的呼叫中心查询。
2. 通话分析：通过挖掘对话日志，快速准确地识别新兴的呼叫模式、客户投诉、情感、不合规行为等，提高呼叫中心的绩效。
3. 坐席辅助：在通话过程中，通过AI-powered文档和内部网搜索，实时帮助坐席进行通话，提高坐席的工作效率和成功率。