介绍
百度语音识别 SDK 封装成的 npm 包,可以在 node.js 和浏览器环境下使用。
安装 baidu-stt
在命令行中安装 baidu-stt。
npm install baidu-stt --save
使用 baidu-stt
创建一个 API Key 和 Secret Key
为了使用 baidu-stt,您需要拥有一个 API Key 和 Secret Key。请按照以下步骤创建它们:
登录百度语音 SDK 管理控制台,进入管理控制台。
在“创建应用”区域中,选择“语音技术”。
填写应用信息,点击“确认”创建应用。
在“应用管理”页面,可以找到“API Key”和“Secret Key”。
初始化 BaiduSTTClient
const BaiduSTTClient = require('baidu-stt'); const apiKey = 'your_api_key'; const secretKey = 'your_secret_key'; const baiduSTTClient = new BaiduSTTClient(apiKey, secretKey);
解析音频文件
const fs = require('fs'); const audioFilePath = 'path/to/audio/file.wav'; const audioBuffer = fs.readFileSync(audioFilePath); const response = await baiduSTTClient.recognize(audioBuffer); console.log(response.result);
语音识别设置参数
const response = await baiduSTTClient.recognize(audioBuffer, { format: 'wav', rate: 16000, devPid: 1537, cuid: 'your_user_id', });
以下是可用的可选参数:
参数名称 | 参数类型 | 说明 |
---|---|---|
format | String | 音频文件格式(pcm/wav/amr) |
rate | Number | 音频采样率(仅支持16k) |
channel | Number | 声道数(仅支持单声道,即1) |
cuid | String | 用户唯一标识,这个参数决定了这个音频是哪个用户进行的 |
token | String | 开放平台开发者获取的 access_token,以及调用 refresh_token 时获取的 refresh_token |
devPid | Number | dev_pid 见上表,识别语种,默认为普通话 |
callback | String | 回调用户结果的 URL,结果以 HTTP POST 的形式传输 |
示例代码
以下是一个完整的示例代码:
-- -------------------- ---- ------- ----- -------------- - --------------------- ----- -- - -------------- ----- ------ - --------------- ----- --------- - ------------------ ----- ------------- - ------------------------- ----- ----------- - ------------------------------- ----- -------------- - --- ---------------------- ----------- ----- -------- - ----- ------------------------------------- - ------- ------ ----- ------ ------- ----- ----- --------------- --- -----------------------------
总结
本文介绍了 npm 包 baidu-stt 的使用方法,包括创建 API Key 和 Secret Key,初始化 BaiduSTTClient,解析音频文件,以及设置可选参数等。如果您需要在您的项目中实现语音识别功能,可以尝试使用 baidu-stt 这个方便易用的 npm 包。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/600562fd81e8991b448e0ccb