跳到主要内容

产品概述

实时语音识别可以将音频码流实时识别成文字。用户可以边说边拿到音频对应的文字。实时语音识别内置智能断句,可提供一句话的中间结果和最终结果。实时语音识别可用于 实时会议纪要,同声字幕等场景。

产品优势

1. 准确率高,性能稳定

普通话识别率高达98%,能够应用不同环境下的语音识别

2. 响应时间快

对音频码流可实现毫秒级别识别,返回中间及最终结果

3. 热词、敏感词可配置化

支持用户自定义敏感词,支持用户自定义热词

4. 方便用户结合RTC音视频使用

可以将其和科达RTC音视频无缝结合,方便用户开发相关智能音视频功能

5. 丰富的开发相关工具及示例

可以对用户开发过程遇到的音视频等功能提供细到的帮助,提供用户可定自化功能