npm 包 @tessdata/amh 使用教程

阅读时长 3 分钟读完

介绍

@tessdata/amh 是一个 OCR 识别工具的数据包,内置了阿拉伯字母、数字的模型,可以用于识别阿拉伯语和波斯语等含有阿拉伯字母的文字。

安装

安装 @tessdata/amh 包很简单,只需要执行以下命令即可:

使用

使用 @tessdata/amh 需要配合 OCR 工具使用,本教程以 Tesseract.js 为例进行说明。

准备工作

在开始使用之前,我们需要先安装 Tesseract.js:

识别文字

安装完 Tesseract.js 后,我们就可以开始使用 @tessdata/amh 了。下面是一个识别阿拉伯语填报表单的实例:

-- -------------------- ---- -------
----- --------- - ------------------------
----- --- - -------------------------

---------------------------------- -
  ----- ----------
  --------- -
    ----------------- -----
    -------- - --
    ------------------------ --------------------------------------------------------------------------------------------------
  --
---------- ----- - ---- - -- -- -
  ------------------
---

在以上代码中,我们导入了 @tessdata/amh 模型,并将其作为 lang 参数传入 Tesseract.js,这样 Tesseract.js 就会使用 @tessdata/amh 模型进行识别。

示例代码

以下是一个完整的用 @tessdata/amh 识别图片文字的例子:

-- -------------------- ---- -------
----- --------- - ------------------------
----- --- - -------------------------

----- ----- - -----------------------------------------------------

-------------------------- -
  ----- ----------
  --------- -
    ----------------- -----
    -------- - --
    ------------------------ --------------------------------------------------------------------------------------------------
  --
---------- ----- - ---- - -- -- -
  ------------------
---

结论

以上就是 @tessdata/amh 的使用教程,希望本文能够对你有所帮助。@tessdata/amh 不仅可以用于识别阿拉伯语和波斯语等含有阿拉伯字母的文字,还为 OCR 技术的应用提供了新的想象空间。如果你对 OCR 技术感兴趣,可以参考 Tesseract.js 的文档,了解更多关于 OCR 的知识。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005623581e8991b448df838

纠错
反馈