npm 包 @tessdata/eus 使用教程

简介

@tessdata/eus 是一个 npm 包,它是从 Tesseract 项目中提取出来的一部分语言数据。

Tesseract 是一个 OCR(Optical Character Recognition,光学字符识别)引擎,它能够识别图像中的字符并将其转换为文本。在 Tesseract 中,不同的语言数据被存储在不同的 *.traineddata 文件中,@tessdata/eus 就是其中之一。

安装

使用 npm 安装:

--- ------- -------------

使用

Node.js

在 Node.js 中使用 @tessdata/eus 很简单。首先,我们需要使用 fs 模块将其加载到内存中。假设我们将其加载到 Tesseract 对象中:

----- -- - --------------
----- --------- - ------------------------

-- - ------------- ------
----- ------- - --------------------------------------------------
----------------------------- ---------

-- -- ---
---------------------------------------- ------------------ -- -
  -------------------------
---

浏览器

在浏览器中使用 @tessdata/eus 更加简单,我们只需要引入它的路径即可:

------- -------------------------------------
--------
  -- -- ------------- ------
  ---------------------------------------- ------------------ -- -
    -------------------------
  ---
---------

注意,在浏览器中使用 @tessdata/eus 对性能有较高要求,因此建议在后端进行 OCR。

示例

我们可以试着使用 @tessdata/eus 对一张图片进行 OCR:

----- -- - --------------
----- --------- - ------------------------
----- ------- - --------------------------------------------------
----------------------------- ---------
------------------------------------------------------------------------- ------------------ -- -
  -------------------------
---

输出结果如下:

--- - ---- -- ----- -------- ---------- -------
----- ------ ----- ----------- --------- --- ---
----- ---- -------- -------- ----- -------- -------
------ ---- --- --- ----- -- ----- ------ ----
-- ------- ------ -------------

总结

@tessdata/eus 是 Tesseract 识别巴斯克语的语言数据,在 Node.js 和浏览器中使用它都十分简单。它的使用可以为我们的 OCR 项目提供支持,同时也可以帮助我们学习如何将外部数据集集成到现有的应用程序中。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6005625281e8991b448df8f7


猜你喜欢

  • npm包@tessdata/mal使用教程

    简介 @tessdata/mal是一个开源的npm包,它提供了一个用于OCR的Tesseract语言包。该包包含了来自马来语、印度尼西亚语和菲律宾语等语言的字符集,可用于文本识别任务。

    3 年前
  • npm 包 @tessdata/mar 使用教程

    简介 @tessdata/mar 是一个基于 Tesseract-OCR 训练数据实现的 OCR 识别库,可用于对图片进行文字识别,支持多种语言。本文将向你介绍如何使用 @tessdata/mar 包...

    3 年前
  • npm 包 @tessdata/mkd 使用教程

    介绍 @tessdata/mkd 是一个开源的 npm 包,用于将 markdown 文件转换为美观的 HTML 页面。它基于 Markdown-It 和 highlight.js ,提供了许多优秀的...

    3 年前
  • npm 包 @tessdata/msa 使用教程

    前置知识 在学习和使用 @tessdata/msa 包前,你需要掌握以下知识: JavaScript 基础语法 Node.js 的安装和使用 npm 包管理器的使用 如果你还不熟悉以上知识,建议先...

    3 年前
  • npm包@tessdata/nep使用教程

    随着人工智能技术的发展,OCR技术在各个方面得到广泛应用。 在OCR的过程中,需要用到识别语言的训练数据文件。 @tessdata/nep是npm上的一个包,其中包含有关Nepali语的训练数据。

    3 年前
  • npm 包 @tessdata/nld 使用教程

    前言 在前端开发中,我们经常会涉及到自然语言处理相关的问题,如文本分类、情感分析、文本生成等。而 @tessdata/nld 这个 npm 包则为我们提供了一个快速、简单的解决方案。

    3 年前
  • npm 包 @tessdata/nor 使用教程

    介绍 @tessdata/nor 是一个提供 OCR 功能的 npm 包。OCR 全称为 Optical Character Recognition,即光学字符识别。

    3 年前
  • npm 包 libcore-package-resolver 使用教程

    简介 在前端开发中,我们经常会用到 npm 包管理器来管理我们的项目依赖。而其中一个很有用的 npm 包就是 libcore-package-resolver。 libcore-package-res...

    3 年前
  • npm包@fuzeman/eslint-import-resolver-babel-module使用教程

    在前端开发中,使用ESLint可以帮助我们发现代码中的潜在问题,保证代码质量。而@fuzeman/eslint-import-resolver-babel-module这个npm包则是用来解决使用we...

    3 年前
  • npm包 mrjs 使用教程

    前言 现如今,前端领域技术正在不断发展,各种工具和框架层出不穷。其中,npm 可以说是不可或缺的一部分,因为很多工具和框架都建立在 npm 包的基础上。而 mrjs 则是 npm 生态系统中的一个非常...

    3 年前
  • NPM 包 @tessdata/mya 使用教程

    简介 @tessdata/mya 是一个用于提供新款缅甸语字体 Tesseract OCR 训练脚本的 npm 包。Tesseract OCR 是一个开放源代码的 OCR 引擎,能够将图像转换为可编辑...

    3 年前
  • npm 包 @tessdata/osd 使用教程

    介绍 @tessdata/osd 是一个 npm 包,用于文字检测和识别。它基于开源 OCR 引擎 Tesseract,并提供了预训练的模型,可用于检测和识别多种文字语言。

    3 年前
  • npm 包 @tessdata/ori 使用教程

    简介 在前端开发中,我们经常需要使用 OCR(Optical Character Recognition)技术对图像中的文字进行识别。而 @tessdata/ori 就是一个 OCR 模型库,可以用于...

    3 年前
  • npm 包 @tessdata/pan 使用教程

    简介 @tessdata/pan 是一个基于 Tesseract OCR 引擎的中文图像文本识别库。该库针对中文语言进行了优化,支持多种文字格式的识别,包括仿宋、楷体等。

    3 年前
  • npm 包 @tessdata/pol 使用教程

    在前端开发中,我们经常需要识别图像中的文字。而 @tessdata/pol 正是一个可用于 OCR(Optical Character Recognition)的开源工具包。

    3 年前
  • npm包assemble-hekyll的使用教程

    简介 assemble-hekyll是一个npm包,它使用了Assemble插件和Handlebars模板引擎,可以方便地将Markdown文档转换为Jekyll网站的页面。

    3 年前
  • npm 包 redux-plugin 使用教程

    在前端应用中,状态管理是至关重要的一环。Redux 可以帮助前端开发者在应用中管理和更新组件共享的数据,有助于提高应用的可靠性和可维护性。而 redux-plugin,是一款方便实用的 Redux 插...

    3 年前
  • npm 包 @tessdata/por 使用教程

    什么是 @tessdata/por @tessdata/por 是一个 npm 包,用于识别多语言文本中的文字。它基于 Tesseract OCR 引擎,支持识别多种语言的文字,并将结果以文本形式返回...

    3 年前
  • npm 包 @tessdata/pus 使用教程

    前言 @tessdata/pus 是一个基于 Tesseract-OCR 的中英文识别模型,可以帮助项目实现文字的自动识别和分析。在前端开发中,这个包可以让我们轻松地集成字识别的功能,提高应用的可用性...

    3 年前
  • npm 包 @tessdata/ron 使用教程

    随着计算机视觉技术的不断发展,OCR 技术也越来越成熟。@tessdata/ron 是一个用于 OCR 技术的 npm 包,它可以将图片中的文字识别出来。 安装 在使用 @tessdata/ron 之...

    3 年前

相关推荐

    暂无文章