产品优势

  • 行业先进的准确率
    讯飞开放平台拥有先进的语音识别技术,核心技术达到先进水平,语音识别准确率已经达到实用标准。
  • 支持个性化热词
    用户可将一些非常见的词汇上传至识别引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,提高专业用语识别准确率。
  • 标点智能预测
    运用超大规模的语言模型,智能预测语境,提供智能断句和标点符号的预测。
  • 文字格式智能转换
    对结果中出现数字、日期、时间等内容格式化成规整的文本。

技术规格

  • 输入

    • 形式:已录制音频

      声道:单声道&多声道

      支持格式:

      wav,flac,opus,m4a,mp3

    • 支持语种:中文普通话、英语

      采样率:8KHz,16KHz

      采样精度:8bits,16bits

  • 输出

    • 形式:json格式字符串

      编码:UTF-8

      结果:分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离

注:

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。

3、语音转写的识别文字结果为异步获取,最长12小时之内获取。

4、语音转写引擎是适用于5小时以内的长音频识别,若您有大量1分钟以内的短音频需要识别,为了提高识别效率,建议使用语音听写服务。

5、使用本服务前请参阅实践指南,以获得更高的转写准确率。

应用场景

  • 电话销售&客服
    将坐席通话转成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础
  • 会议&访谈记录
    将会议和访谈的音频转换成文字存稿,让后期的信息检索和整理更方便快捷
  • 字幕生成
    将视频中音频文件进行语音转写,轻松生成与视频相对应的字幕文件

客户案例

  • 上海电视台
  • 天润融通
  • 唱吧
  • 掌众金服
  • 爱屋吉屋

产品价格

以下套餐针对开发者用户调用接口时使用。如果您是个人用户,希望实现在线语音转文字功能,可访问讯飞听见官网

套餐 体验包 新用户礼包 套餐一 套餐二 套餐三 套餐四
时长量 5小时 最高50小时 10小时 200小时 1000小时 3000小时
有效期 30天 一年 一年 一年 一年 一年
单价(元/小时) 免费 免费

¥9.9/小时

¥8.8/小时

¥5.9/小时

¥4.9/小时

¥4.9/小时

¥3.9/小时

¥4.9/小时

¥3.5/小时

总价(元) 免费 免费

¥99

¥88

¥1180

¥980

¥4900

¥3900

¥14700

¥10500

使用服务 立即领取 立即领取 立即购买 立即购买 立即购买 立即购买

温馨提示:

1、平台免费赠送的时长为5小时,供测试使用,每个账户限领取1次;

2、后台计量系统根据您的实际使用情况,以秒为单位向上取整,进行使用量扣除;

3、订单和套餐使用情况可在“控制台”查看;

4、本产品一经购买,不支持退货;

5、扣量优先级:免费试用>批量购买,即在“批量购买”的套餐额度剩余的情况下,又领取了免费试用的体验包,则领取的免费试用体验包立即生效,并被设定为当前扣量套餐。而之前购买的套餐包的额度和到期日不变。

疑问解答

  • “语音转写 ”与 “语音听写 ”的区别是?

  • 产品名称 支持的音频时长 使用场景
    语音听写 一分钟以内 人机对话,如输入法、语音搜索
    语音转写 五小时以内 更自然地贴近日常的对话和演讲
  • “已录制音频转写”和“实时音频流转写”的区别是?

  • 已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

    实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果。可以实现文字和声音的同步展现。

    实时语音转写已上线,欢迎使用。
查看更多