npm 包 @tessdata/dzo 使用教程-JavaScript中文网-JavaScript教程资源分享门户

在前端开发中，文字的识别与处理是一个常见的需求，而 OCR （Optical Character Recognition，光学字符识别）是一种可用于实现文字识别的技术。本文将介绍一种基于 OCR 技术的 npm 包 @tessdata/dzo 以及其使用教程。

什么是 @tessdata/dzo？

@tessdata/dzo 是基于 Tesseract.js 的一个 npm 包，它可以将不同类型的图片转换成文本并进行处理。它支持多种语言，并且已经预先训练好了一些数据集，既可以灵活定制出符合用户需求的识别效果，也可以在不增加额外训练成本的情况下应用到各种场景中。

如何使用 @tessdata/dzo？

安装

在开始使用 @tessdata/dzo 之前，我们需要在本地安装 Tesseract.js。如果你已经安装了 Tesseract.js，请跳过该步骤。

npm install tesseract.js --save

然后，我们可以安装 @tessdata/dzo。

npm install @tessdata/dzo --save

使用

接下来，我们需要引入 @tessdata/dzo。

const Dzo = require('@tessdata/dzo');

然后我们创建一个 Dzo 的实例。

const dzo = new Dzo();

@tessdata/dzo 提供了一个 recognize 函数，可以将图片转换为文本。

dzo.recognize('path/to/image.png').then((result) => {
  console.log(result.text);
});

定制

@tessdata/dzo 提供了一些选项，可以帮助用户定制转换的策略。

选项	类型	描述
lang	string	识别使用的语言（默认为 eng）
psm	number	段落模式（默认为 3）
oem	number	引擎模式（默认为 3）

-- -------------------- ---- -------
----- ------- - -
  ----- ---------- -- ----
  ---- -- -- ---- -
  ---- -- -- ---- -
--

---------------------------------- ---------------------- -- -
  -------------------------
---

处理文本

在获得文本之后，我们可以对文本进行二次处理。

dzo.recognize('path/to/image.png').then((result) => {
  const text = result.text.trim(); // 去除多余空格
  const lines = text.split('\n'); // 按行切割
  console.log(lines);
});

示例代码

-- -------------------- ---- -------
----- --- - -------------------------

----- --- - --- ------

----- ------- - -
  ----- ----------
  ---- --
  ---- --
--

---------------------------------- ---------------------- -- -
  ----- ---- - -------------------
  ----- ----- - -----------------
  -------------------
---

总结

@tessdata/dzo 是一个基于 OCR 技术的 npm 包，可以将图片转换为文本。在使用过程中，我们可以定制转换策略，然后再对文本进行二次处理。希望本文能够帮助到大家。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/6005624c81e8991b448df8c9

npm 包 @tessdata/dzo 使用教程

什么是 @tessdata/dzo？

如何使用 @tessdata/dzo？

安装

使用

定制

处理文本

示例代码

总结

纠错反馈

程序员教程

程序员面试题库