npm 包 @tessdata/deu 使用教程

阅读时长 4 分钟读完

简介

tessdata 是一个基于 Tesseract OCR 的开源 OCR 引擎。@tessdata/deu 是其中的一个语言数据包,它支持德语 OCR。

这篇文章将详细介绍如何在前端项目中使用 @tessdata/deu 包来实现德语 OCR 的功能。

安装

执行以下命令来安装 @tessdata/deu 包:

使用

初始化 Tesseract OCR 引擎

在使用 @tessdata/deu 包之前,必须先初始化 Tesseract OCR 引擎。可以使用 tesseract.js 包来完成该任务,因此需要先安装该包:

引入 tesseract.js 并初始化 Tesseract OCR 引擎:

其中,imageData 是图像数据,可以是 ArrayBufferUint8ArrayBufferBlob 等格式。

使用 @tessdata/deu 包

安装和引入 @tessdata/deu 包:

-- -------------------- ---- -------
-- -- ------------- -
----- ------ - --- ---------------------------
  ----------- -----------------------------------------------
  --------- -----------------------------
  --------- ------------------------------------------
---

-- -- -------
--------------------------------------- -- -
  -------------------------
  -------------------
---

其中,langPath 参数指定语言数据包所在的路径。

示例代码

以下是一个完整的示例代码,它演示了如何从一个图像中识别出文本:

-- -------------------- ---- -------
----- --------- - ------------------------
----- ------ - --- ---------------------------
  ----------- -----------------------------------------------
  --------- -----------------------------
  --------- ------------------------------------------
---

----- ----- - --- --------
----------------- - ------------
--------- - -----------------------------------------------------

------------ - -- -- -
  ----- ------ - ---------------------------------
  ------------ - ------------
  ------------- - -------------
  ----- ------- - ------------------------
  ------------------------ -- ---

  ----- --------- - ----------------------- -- ------------- ---------------

  --------------------------------------- -- -
    -------------------------
    -------------------
  ---
--

总结

本文介绍了如何在前端项目中使用 @tessdata/deu 包来实现德语 OCR 的功能。需要注意的是,在使用 @tessdata/deu 包之前,必须先初始化 Tesseract OCR 引擎。

希望本文对您有所帮助,也欢迎大家提出宝贵的意见和建议。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005625281e8991b448df8ef

纠错
反馈