跳到主要内容

快速集成

本文主要介绍如何使用 KASRSDK 以及科达视讯平台实现实时语音识别功能。

音频格式要求

  • 采样率:16KHz
  • 采样位数:16bits
  • 通道数:单通道
  • 音频格式:无压缩PCM或WAVE

调用流程

首先包含KASRSDK库

<script src="kasrsdk.js">
</script>

1. 初始化KASRSDK

在调用其他 KASRSDK 接口前,可以进行化,设置日志等参数.

KASRSDK.init({isEnableLog:true});

2. 获取 KAsrClient 对象

为使用 KASRSDK 视讯接口,您需要先获取 KAsrClient 对象

let client = KASRSDK.createAsrInstance();

KASRSDK 支持多实例模式,您需要为每个 KAsrClient 对象分别注册回调

client.init({onStart:result=>{
console.log(result)
},
onRecogResult:result=>{
console.log(result.text);
}});

3. 开始会话

在进行实时转写前,您需要打开一个会话

let code = client.start({serveraddr:'wss://dev.kedacom.com/kasr',token:'xxx'});

验证成功后,您会收到 onStart 回调.

4. 传输音频

在成功打开会话后,就可以传输音频了(单声道,采样率16k, 量化的精度16bit )。

client.feed({data:data});

当后台识别到文本后,您会收到onRecogResult回调

5. 结束会话

调用以下接口来结束会话,退出后SDK会自动释放相关资源

client.stop();

成功结束会话时您会收到 onStop 回调