NPM包 Polly-SSML-Split 使用教程-JavaScript中文网-JavaScript教程资源分享门户

Polly-SSML-Split 是一个可以将大段的 SSML（Speech Synthesis Markup Language）语音合成标记语言文件分割成多个独立的段落的 Node.js 包。在 TTS（Text-to-Speech）应用程序中，这种分割方式可以使得语音合成更加精准，减少错误和重复。

本文将介绍如何使用 Polly-SSML-Split 进行语音合成，并提供示例代码供参考。

安装

你可以在你的 Node.js 项目中使用 npm 来安装 polly-ssml-split 包：

npm install polly-ssml-split --save

使用

使用 Polly-SSML-Split 进行语音合成需要以下步骤：

在 AWS 控制台为您的语音合成服务创建一个 AWS Polly 合成语音任务。生成的 SSML 文件将作为输入文件用于 Polly-SSML-Split。
使用 Polly-SSML-Split 对输入的 SSML 文件进行拆分处理，使其适应各种 TTS 应用场景。
通过 TTS 引擎，例如 Amazon Polly，将每个独立的段落转换成语音，并将它们组合成一整段语音。

SSML 拆分

首先，我们需要导入 polly-ssml-split 包并创建一个新实例。你可以通过传递一个选项对象来配置 Polly-SSML-Split 的行为：

-- -------------------- ---- -------
----- -------- - ----------------------------

----- -------------- - -
  ------------ -----
  --------------- -----
  ---------- --
  --------------- ----
  --------------- ----
  ------ ------
--

----- -------- - --- -------------------------展开代码

这里，我们设置了拆分块的默认长度和各种其他选项。使用对象字面量，我们可以轻松地更改这些默认值。

现在，让我们看一下如何使用 splitter 实例将 SSML 文件拆分成较小的语音段。

const ssmlContent = '<speak>今天天气不错，出去逛逛吧。</speak>';

return splitter
  .split(ssmlContent)
  .map((s, i) => `<speak>${s}</speak><break time='(pause)${splitter.postSilence[i]}'/>`)
  .join('');

这里，我们将原始的 SSML 文件传递给 splitter 的 split 方法。方法返回一个内容数组，每个元素都代表了原始 SSML 文件的一个拆分块。我们还在句子之间插入了暂停，这些暂停的长度等于 splitter.postSilence 中对应元素的值。

最后，我们使用 join 方法将输出的内容连接成一个字符串。这个字符串可以传递给 TTS 引擎进行语音合成。

示例代码

-- -------------------- ---- -------
----- -------- - ----------------------------

----- -------------- - -
  ------------ -----
  --------------- -----
  ---------- --
  --------------- ----
  --------------- ----
  ------ ------
--

----- -------- - --- -------------------------

----- ----------- - -------------------------------

----- ------------- - --------
  -------------------
  -------- -- -- -------------------------- --------------------------------------------
  ----------

---------------------------展开代码

输出如下：

<speak>今天天气不错，</speak><break time='(pause)750'/>
<speak>出去逛逛吧。</speak><break time='(pause)850'/>

这个输出可将原始语句分为两个独立的段落，并且这两个段落之间有一个暂停。这使得语音合成更加精确和自然。

总结

Polly-SSML-Split 是一个方便、易于使用的 Node.js 包，可帮助您将 SSML 文件拆分成多个更小的语音段，从而提高语音合成质量。本文展示了如何使用该包，并提供了示例代码供参考。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/60065b44c6eb7e50355dbe51

NPM包 Polly-SSML-Split 使用教程

安装

使用

SSML 拆分

示例代码

总结

纠错反馈

程序员教程

程序员面试题库