简介
@tessdata/eus
是一个 npm 包,它是从 Tesseract 项目中提取出来的一部分语言数据。
Tesseract 是一个 OCR(Optical Character Recognition,光学字符识别)引擎,它能够识别图像中的字符并将其转换为文本。在 Tesseract 中,不同的语言数据被存储在不同的 *.traineddata
文件中,@tessdata/eus
就是其中之一。
安装
使用 npm
安装:
--- ------- -------------
使用
Node.js
在 Node.js 中使用 @tessdata/eus
很简单。首先,我们需要使用 fs
模块将其加载到内存中。假设我们将其加载到 Tesseract
对象中:
----- -- - -------------- ----- --------- - ------------------------ -- - ------------- ------ ----- ------- - -------------------------------------------------- ----------------------------- --------- -- -- --- ---------------------------------------- ------------------ -- - ------------------------- ---
浏览器
在浏览器中使用 @tessdata/eus
更加简单,我们只需要引入它的路径即可:
------- ------------------------------------- -------- -- -- ------------- ------ ---------------------------------------- ------------------ -- - ------------------------- --- ---------
注意,在浏览器中使用 @tessdata/eus
对性能有较高要求,因此建议在后端进行 OCR。
示例
我们可以试着使用 @tessdata/eus
对一张图片进行 OCR:
----- -- - -------------- ----- --------- - ------------------------ ----- ------- - -------------------------------------------------- ----------------------------- --------- ------------------------------------------------------------------------- ------------------ -- - ------------------------- ---
输出结果如下:
--- - ---- -- ----- -------- ---------- ------- ----- ------ ----- ----------- --------- --- --- ----- ---- -------- -------- ----- -------- ------- ------ ---- --- --- ----- -- ----- ------ ---- -- ------- ------ -------------
总结
@tessdata/eus
是 Tesseract 识别巴斯克语的语言数据,在 Node.js 和浏览器中使用它都十分简单。它的使用可以为我们的 OCR 项目提供支持,同时也可以帮助我们学习如何将外部数据集集成到现有的应用程序中。
来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6005625281e8991b448df8f7