快速集成
本文主要介绍如何使用 KASRSDK 以及科达视讯平台实现实时语音识别功能。
音频格式要求
- 采样率:16KHz
- 采样位数:16bits
- 通道数:单通道
- 音频格式:无压缩PCM或WAVE
调用流程
首先包含KASRSDK库
<script src="kasrsdk.js">
</script>
1. 初始化KASRSDK
在调用其他 KASRSDK 接口前,可以进行化,设置日志等参数.
KASRSDK.init({isEnableLog:true});
2. 获取 KAsrClient 对象
为使用 KASRSDK 视讯接口,您需要先获取 KAsrClient 对象
let client = KASRSDK.createAsrInstance();
KASRSDK 支持多实例模式,您需要为每个 KAsrClient 对象分别注册回调
client.init({onStart:result=>{
console.log(result)
},
onRecogResult:result=>{
console.log(result.text);
}});
3. 开始会话
在进行实时转写前,您需要打开一个会话
let code = client.start({serveraddr:'wss://dev.kedacom.com/kasr',token:'xxx'});
验证成功后,您会收到 onStart 回调.
4. 传输音频
在成功打开会话后,就可以传输音频了(单声道,采样率16k, 量化的精度16bit )。
client.feed({data:data});
当后台识别到文本后,您会收到onRecogResult回调
5. 结束会话
调用以下接口来结束会话,退出后SDK会自动释放相关资源
client.stop();
成功结束会话时您会收到 onStop 回调