产品优势
-
行业先进的准确率讯飞开放平台拥有先进的语音识别技术,核心技术达到先进水平,语音识别准确率已经达到实用标准。
-
支持个性化热词用户可将一些非常见的词汇上传至识别引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,提高专业用语识别准确率。
-
标点智能预测运用超大规模的语言模型,智能预测语境,提供智能断句和标点符号的预测。
-
文字格式智能转换对结果中出现数字、日期、时间等内容格式化成规整的文本。
技术规格
-
输入
-
形式:已录制音频
声道:单声道&多声道
支持格式:
wav,flac,opus,m4a,mp3
-
支持语种:中文普通话、英语
采样率:8KHz,16KHz
采样精度:8bits,16bits
-
-
输出
-
形式:json格式字符串
编码:UTF-8
结果:分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离
-
应用场景
-
电话销售&客服将坐席通话转成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础
-
会议&访谈记录将会议和访谈的音频转换成文字存稿,让后期的信息检索和整理更方便快捷
-
字幕生成将视频中音频文件进行语音转写,轻松生成与视频相对应的字幕文件
客户案例
-
上海电视台
-
天润融通
-
唱吧
-
掌众金服
-
爱屋吉屋
产品价格
以下套餐针对开发者用户调用接口时使用。如果您是个人用户,希望实现在线语音转文字功能,可访问讯飞听见官网。
套餐 | 体验包 | 新用户礼包 | 套餐一 | 套餐二 | 套餐三 | 套餐四 |
---|---|---|---|---|---|---|
时长量 | 5小时 | 最高50小时 | 10小时 | 200小时 | 1000小时 | 3000小时 |
有效期 | 30天 | 一年 | 一年 | 一年 | 一年 | 一年 |
单价(元/小时) | 免费 | 免费 |
¥9.9/小时 ¥8.8/小时 |
¥5.9/小时 ¥4.9/小时 |
¥4.9/小时 ¥3.9/小时 |
¥4.9/小时 ¥3.5/小时 |
总价(元) | 免费 | 免费 |
¥99 ¥88 |
¥1180 ¥980 |
¥4900 ¥3900 |
¥14700 ¥10500 |
使用服务 | 立即领取 | 立即领取 | 立即购买 | 立即购买 | 立即购买 | 立即购买 |
温馨提示:
1、平台免费赠送的时长为5小时,供测试使用,每个账户限领取1次;
2、后台计量系统根据您的实际使用情况,以秒为单位向上取整,进行使用量扣除;
3、订单和套餐使用情况可在“控制台”查看;
4、本产品一经购买,不支持退货;
5、扣量优先级:免费试用>批量购买,即在“批量购买”的套餐额度剩余的情况下,又领取了免费试用的体验包,则领取的免费试用体验包立即生效,并被设定为当前扣量套餐。而之前购买的套餐包的额度和到期日不变。
开发者资源
-
Web API
-
Java SDK
-
技术交流
-
条款协议
疑问解答
-
“语音转写 ”与 “语音听写 ”的区别是?
-
产品名称 支持的音频时长 使用场景 语音听写 一分钟以内 人机对话,如输入法、语音搜索 语音转写 五小时以内 更自然地贴近日常的对话和演讲 -
“已录制音频转写”和“实时音频流转写”的区别是?
-
已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果。可以实现文字和声音的同步展现。