在前端开发中,语音转文字的需求越来越常见,特别是在一些需要语音输入的场合。@comsultia/speech2text 是一个基于 Google 的语音识别 API 的 npm 包,提供了通过语音输入获取文字输出的功能。在本文中,我们将给大家详细介绍这个 npm 包的使用方法。
安装
使用 npm 进行安装:
npm install @comsultia/speech2text --save
初始化
首先,我们需要在页面或组件中引用该模块,并初始化一个实例:
import Speech2Text from '@comsultia/speech2text'; const speech2text = new Speech2Text();
在初始化时,您也可以传递一些配置选项:
const speech2text = new Speech2Text({ language: 'en-US', // 语言 maxResults: 1, // 最大结果数 interimResults: true, // 是否返回临时结果 continuous: true, // 是否连续语音转文字 key: 'your-google-key', // Google 账户 API Key debug: false, // 是否打印调试信息 });
使用
start 方法
启动语音转文字功能:
speech2text.start();
该方法将启动麦克风,并开始语音输入。如果 continuous
为 true
,则会自动开始下一次语音输入。
stop 方法
结束语音转文字功能:
speech2text.stop();
该方法将结束语音输入,并将获取到的结果返回。
onResult 事件
语音转文字完成后触发。该事件会返回识别结果的集合,可以包含多个结果。每个结果对象包括 transcript
、confidence
和 isFinal
三个属性。
speech2text.onResult = (result) => { console.log(result); };
onError 事件
语音转文字出错时触发。
speech2text.onError = (error) => { console.log(error); };
示例代码
下面是一个使用示例,演示如何将语音输入转换为文字输出:
import Speech2Text from '@comsultia/speech2text'; const speech2text = new Speech2Text(); speech2text.onResult = (results) => { const text = results[0].transcript; console.log(text); }; speech2text.start(); setTimeout(() => { speech2text.stop(); }, 5000);
以上代码将启动语音转文字功能,当获取到语音输入后,将其转换为文字并输出到控制台。在 5 秒钟后,语音转文字功能将自动停止。
结论
@comsultia/speech2text 是一个非常有用的 npm 包,可以轻松实现语音转文字的功能。通过本文的介绍,我们希望您能够更好地使用它。此外,我们还可以添加错误处理和其他功能以满足特定的需求。
来源:JavaScript中文网 ,转载请注明来源 本文地址:https://www.javascriptcn.com/post/600673dffb81d47349e53c8b