产品特性
-
支持个性化热词用户可将一些非常见的词汇上传至识别引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,提高专业用语识别准确率。
-
上下文纠错针对上下文进行语义理解,将中间结果进行智能纠错,确保准确性。
-
文字流时间戳对于音频流实现毫秒级识别,并返回带有时间戳的文字流,便于二次开发。
-
标点智能预测运用超大规模的语言模型,智能预测语境,提供智能断句和标点符号的预测。
技术规格
-
输入
-
形式:实时音频流
支持格式:PCM
采样率:16KHz
采样精度:16bits
-
支持语种:中文普通话
声道:单声道
分片时长:40ms
-
-
输出
-
形式:json格式字符串
编码:UTF-8
结果:句子开始&结束时间&词识别内容&词标识&词开始时间&词结束时间&结果类型标识&段落ID,整句的中间结果,整句的最终结果
-
注:
1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。
2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。
3、语言支持:中国大陆地区普通话。后续将支持更多语种。
4、讯飞开放平台的实时语音转写需接入WebSocket API接口,针对有编程基础的开发者用户。如果您是个人用户,不想通过编程方式直接实现语音转写功能,可以去讯飞听见官网,了解语音转写功能的更多详情。
应用场景
-
直播字幕在电视直播或现场直播过程中提供实时字幕,提升直播效果
-
视频会议&电话会议将视频以及电话会议中的发言内容实时识别为文字,防止错过重要会议内容,提高会议效率
-
客服中心将客户的电话语音内容实时识别为文字,作为客服答疑的参考记录
客户案例
-
上海电视台
-
天润融通
-
唱吧
-
掌众金服
-
爱屋吉屋
套餐 | 免费包 | 新用户礼包 | 时长套餐一 | 时长套餐二 | 时长套餐三 | 时长套餐四 | 并发套餐 |
---|---|---|---|---|---|---|---|
时长 | 24小时 | 最高50小时 | 10小时 | 200小时 | 1000小时 | 3000小时 | 不限时长 |
支持并发 | 1路 | 1路 | 10路 | 10路 | 10路 | 10路 | 按需 |
有效期 | 15天 | 一年 | 一年 | 一年 | 一年 | 一年 | 一年 |
价格 | 免费 | 免费 | ¥99.00 | ¥1780.00 | ¥6900.00 | ¥14700.00 | 按并发收费 |
单价(元/小时) | 免费 | 免费 | ¥9.90 | ¥8.90 | ¥6.90 | ¥4.90 | 1万元-2万元(每路每年) |
使用产品 | 领取 | 领取 | 立即购买 | 立即购买 | 立即购买 | 立即购买 | 商务对接 |
温馨提示:
1、每个用户仅可领取一次免费包;
2、购买时长套餐,可使用10路并发,若需要更多并发或者一次性购买量较大,可进行商务工单对接;
3、时长套餐与并发套餐成本计算方式不同,暂不提供套餐转换功能,请根据您的需要选择。
开发者资源
温馨提示
开放平台“实时语音转写”需要WebSocket接入,针对是有编程基础的开发者用户。如果您是个人用户,不想通过编程方式直接实现语音转写功能,可以去讯飞听见官网,了解语音转写功能的更多详情。