npm 包 @tessdata/amh 使用教程-JavaScript中文网-JavaScript教程资源分享门户

介绍

@tessdata/amh 是一个 OCR 识别工具的数据包，内置了阿拉伯字母、数字的模型，可以用于识别阿拉伯语和波斯语等含有阿拉伯字母的文字。

安装

安装 @tessdata/amh 包很简单，只需要执行以下命令即可：

npm install @tessdata/amh

使用

使用 @tessdata/amh 需要配合 OCR 工具使用，本教程以 Tesseract.js 为例进行说明。

准备工作

在开始使用之前，我们需要先安装 Tesseract.js：

npm install tesseract.js

识别文字

安装完 Tesseract.js 后，我们就可以开始使用 @tessdata/amh 了。下面是一个识别阿拉伯语填报表单的实例：

-- -------------------- ---- -------
----- --------- - ------------------------
----- --- - -------------------------

---------------------------------- -
  ----- ----------
  --------- -
    ----------------- -----
    -------- - --
    ------------------------ --------------------------------------------------------------------------------------------------
  --
---------- ----- - ---- - -- -- -
  ------------------
---

在以上代码中，我们导入了 @tessdata/amh 模型，并将其作为 lang 参数传入 Tesseract.js，这样 Tesseract.js 就会使用 @tessdata/amh 模型进行识别。

示例代码

以下是一个完整的用 @tessdata/amh 识别图片文字的例子：

-- -------------------- ---- -------
----- --------- - ------------------------
----- --- - -------------------------

----- ----- - -----------------------------------------------------

-------------------------- -
  ----- ----------
  --------- -
    ----------------- -----
    -------- - --
    ------------------------ --------------------------------------------------------------------------------------------------
  --
---------- ----- - ---- - -- -- -
  ------------------
---

结论

以上就是 @tessdata/amh 的使用教程，希望本文能够对你有所帮助。@tessdata/amh 不仅可以用于识别阿拉伯语和波斯语等含有阿拉伯字母的文字，还为 OCR 技术的应用提供了新的想象空间。如果你对 OCR 技术感兴趣，可以参考 Tesseract.js 的文档，了解更多关于 OCR 的知识。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/6005623581e8991b448df838