实时语音转写 - 语音识别 - 青岛人工智能开放平台

尊敬的合作伙伴：

为贯彻落实国务院相关部署要求，着力整治骚扰电话扰民问题，工信部新发布《综合整治骚扰电话专项行动方案》、《关于推进综合整治骚扰电话专项行动的工作方案》等方案对整治骚扰电话进行相关指导。讯飞开放平台在此基础上更新服务协议，请各位合作伙伴认真阅读并遵守：《讯飞开放平台用户服务协议》。

科大讯飞坚持源头技术创新，智能语音技术持续处于先进地位，并且积极打造围绕讯飞智能语音技术的产业生态，通过讯飞开放平台将语音能力开放给第三方合作伙伴。为促进社会稳定和维护平台的可持续发展，对于利用讯飞技术进行违规运营和操作的任何合作伙伴，平台将严格依据服务协议进行终止合作并追究相关法律责任。讯飞开放平台期待与合作伙伴们携手共进，共同维护平台运营秩序，用人工智能建设美好世界。

讯飞开放平台

2018年11月9日

产品特性

支持个性化热词

用户可将一些非常见的词汇上传至识别引擎，当实时转写的音频流中出现该词汇时，引擎可将其识别出来，提高专业用语识别准确率。
上下文纠错

针对上下文进行语义理解，将中间结果进行智能纠错，确保准确性。
文字流时间戳

对于音频流实现毫秒级识别，并返回带有时间戳的文字流，便于二次开发。
标点智能预测

运用超大规模的语言模型，智能预测语境，提供智能断句和标点符号的预测。

技术规格

输入
- 形式：实时音频流
  
  支持格式：PCM
  
  采样率：16KHz
  
  采样精度：16bits
- 支持语种：中文普通话
  
  声道：单声道
  
  分片时长：40ms
输出
- 形式：json格式字符串
  
  编码：UTF-8
  
  结果：句子开始&结束时间&词识别内容&词标识&词开始时间&词结束时间&结果类型标识&段落ID，整句的中间结果，整句的最终结果

注：

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整，如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括：普通词；语气犹豫词，如“嗯”、“啊”、“呃”或者无意义的重复词等；标点符号，如“，”等。

3、语言支持：中国大陆地区普通话。后续将支持更多语种。

4、讯飞开放平台的实时语音转写需接入WebSocket API接口，针对有编程基础的开发者用户。如果您是个人用户，不想通过编程方式直接实现语音转写功能，可以去讯飞听见官网，了解语音转写功能的更多详情。

应用场景

直播字幕

在电视直播或现场直播过程中提供实时字幕，提升直播效果
视频会议&电话会议

将视频以及电话会议中的发言内容实时识别为文字，防止错过重要会议内容，提高会议效率
客服中心

将客户的电话语音内容实时识别为文字，作为客服答疑的参考记录

客户案例

上海电视台
天润融通
唱吧
掌众金服
爱屋吉屋

产品价格

套餐	免费包	新用户礼包	时长套餐一	时长套餐二	时长套餐三	时长套餐四	并发套餐
时长	24小时	最高50小时	10小时	200小时	1000小时	3000小时	不限时长
支持并发	1路	1路	10路	10路	10路	10路	按需
有效期	15天	一年	一年	一年	一年	一年	一年
价格	免费	免费	￥99.00	￥1780.00	￥6900.00	￥14700.00	按并发收费
单价（元/小时）	免费	免费	￥9.90	￥8.90	￥6.90	￥4.90	1万元-2万元（每路每年）
使用产品	领取	领取	立即购买	立即购买	立即购买	立即购买	商务对接

温馨提示：

1、每个用户仅可领取一次免费包；

2、购买时长套餐，可使用10路并发，若需要更多并发或者一次性购买量较大，可进行商务工单对接；

3、时长套餐与并发套餐成本计算方式不同，暂不提供套餐转换功能，请根据您的需要选择。

开发者资源

Web API 开发文档

温馨提示

开放平台“实时语音转写”需要WebSocket接入，针对是有编程基础的开发者用户。如果您是个人用户，不想通过编程方式直接实现语音转写功能，可以去讯飞听见官网，了解语音转写功能的更多详情。