npm 包 @tessdata/est 使用教程

前言

随着计算机视觉领域的不断发展,OCR 技术也日趋成熟。OCR 技术可以将图片中的文字信息转化为文本数据,方便进行文本处理。@tessdata/est 是一个 Node.js 库,主要用于将图片中的文字信息转换为文本数据。本文就将为大家介绍如何使用 @tessdata/est 包。

安装

首先你需要安装 Node.js 环境,如果你还没有安装,请前往官网进行下载安装:https://nodejs.org/

完成 Node.js 安装之后,我们就可以使用 npm 工具来安装 @tessdata/est 包了。打开终端并输入以下命令以安装:

--- ------- -------------

安装完成之后,就可以在项目中引入 @tessdata/est 库了。

使用

初始化

为了能够初始化 @tessdata/est 包,我们需要通过下面这行代码来引入它:

----- - --------------- - - ------------------------

引入之后,我们就可以使用 TesseractWorker 类来初始化 @tessdata/est 包。TesseractWorker 类可以接收一个配置对象,该对象中包含了以下几个属性:

  • lang:需要识别的语言类型,例如 'eng' 表示英语;
  • tessdata:包含要加载的语言数据的目录路径;
  • workerPath:Tesseract.js 工作线程的位置。

下面是一个基本的配置示例:

----- ------ - --- -----------------
  ----- ------
  --------- -------------
  ----------- ------------------------------------------------
---

加载图片

当我们初始化 TesseractWorker 之后,就可以使用 .recognize() 方法来加载需要识别的图片了。.recognize() 方法需要传入一个路径参数,该路径参数指向要加载的图片路径:

------
  -------------------------
  ------------ -- -
    -------------------------
  ---

result.text 属性是一个识别结果字符串,可以通过打印 result.text 来查看识别结果。

附加参数

除了基本的配置之外, @tessdata/est 还支持传入一些附加参数来优化识别效果。下面是一些支持的附加参数:

  • psm:Page Segmentation Mode,指定 OCR 使用哪种分割模式,默认值为 3,表示按照行排列的文本块;
  • oem:OCR Engine Mode,指定 OCR 使用哪种引擎,默认值为 3,表示使用 LSTM+Tesseract 组合引擎。

示例代码如下:

------
  ------------------------- -
    ---- --
    ---- -
  --
  ------------ -- -
    -------------------------
  ---

结语

通过本教程,我们学习了如何使用 @tessdata/est 包来进行 OCR 技术的开发。@tessdata/est 包非常易用,只需要传入图片路径即可进行文本识别。在实际开发中,还可以通过传入附加参数来优化识别效果。我们希望这篇文章能够对大家在 OCR 技术的学习和开发中提供有帮助的指导。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6005625281e8991b448df8f5


猜你喜欢

  • npm 包 raman 使用教程

    简介 raman 是一个适用于前端开发的 npm 包,主要用于颜色操作与转换。它具有如下特性: 支持 RGB、HEX、HSL、HSV、CMYK 颜色空间的转换; 支持颜色对比度计算、亮度调整等高级操...

    3 年前
  • npm 包 enem-score-calculator 使用教程

    简介 enem-score-calculator 是一个方便的 npm 包,用于计算巴西全国中等教育考试(ENEM)的成绩。ENEM 是巴西的一项全国性考试,对于高中生的升学以及各种大学入学考试有着重...

    3 年前
  • npm 包 @tessdata/kat 使用教程

    在计算机视觉领域,光学字符识别(Optical Character Recognition,简称 OCR)是一个成熟的技术。而 Tesseract 是一个流行的开源 OCR 引擎,可以识别多种语言文字...

    3 年前
  • npm 包 @tessdata/khm 使用教程

    在前端开发中,有时需要使用 OCR 技术来识别图像中的文字。而 tesseract-ocr 是一个强大的文字识别库,可以通过 npm 包 @tessdata/khm 的方式轻松使用。

    3 年前
  • npm 包 @tessdata/kir 使用教程

    简介 @tessdata/kir 是一个基于 Tesseract OCR 引擎训练的简体中文文字识别模型。使用该模型,可将包含中文文字的图像转换为文本。 安装 使用 npm 安装 @tessdata/...

    3 年前
  • npm 包 @tessdata/lao 使用教程

    前言 在进行 OCR(Optical Character Recognition,光学字符识别)技术开发中,数据集是必不可少的。@tessdata/lao 就是提供了为 OCR 提供可用数据集的 np...

    3 年前
  • npm 包 @tessdata/lat 使用教程

    随着计算机视觉技术的发展,文字识别成为了其中一个重要的应用场景,而 tesseractjs 就是一个常用的 JavaScript OCR 引擎。但是在使用中,需要将 tesseractjs 与相应的语...

    3 年前
  • npm 包 @tessdata/kaz 使用教程

    前言 @tessdata/kaz 是一款基于 Tesseract OCR 引擎的 npm 包,提供了中文的 OCR 识别能力,可以识别语种为中文(简体和繁体)、日语、泰语等。

    3 年前
  • npm 包 @tessdata/mlt 使用教程

    前言 随着人工智能的快速发展,将文字转化成计算机能够处理的数据已经变得越来越普遍。OCR(Optical Character Recognition)技术就是其中一个很好的例子。

    3 年前
  • npm 包 @tessdata/jpn 使用教程

    随着全球化发展,不同语言的处理需求变得越来越普遍。其中对于日语的处理需求尤为强烈,而 npm 包 @tessdata/jpn 为解决日语 OCR(光学字符识别)问题提供了一种高效的方案。

    3 年前
  • npm 包 @tessdata/kur 使用教程

    简介 @tessdata/kur 是一个用于 OCR(Optical Character Recognition)技术的机器学习框架。它提供了一个用于训练和测试 OCR 模型的命令行工具,可以使用自然...

    3 年前
  • npm 包 @tessdata/kor 的使用教程

    简介 @tessdata/kor 是一个用于 OCR(光学字符识别)的语言包,支持韩语字符识别。它是由 Tesseract OCR 项目和 Tesseract Data Repository 提供的开...

    3 年前
  • npm 包 es-eql 使用教程

    简介 es-eql 是一个非常实用的npm包,它可以帮助我们在 JavaScript 中实现灵活的、快捷的比较判断操作。该包所提供的方法可以支持对象的深度比较,使得开发者能够更加高效地编写代码,提高开...

    3 年前
  • NPM 包 layer-settings 使用教程

    前端开发中,我们经常需要使用弹出层来实现一些效果。而现在,使用 npm 包 layer-settings 可以非常方便地实现弹出层的效果。本文将介绍如何使用该包。 什么是 layer-settings...

    3 年前
  • npm 包 generator-cpv-core-node-express 使用教程

    前言 generator-cpv-core-node-express 是一个基于 Yeoman 的 npm 包,用于快速搭建 Node.js 与 Express 的 Web 项目。

    3 年前
  • npm 包 bierstadt 使用教程

    什么是 bierstadt bierstadt 是一款前端开发中常用的 npm 包,用于在开发过程中轻松生成随机数据或测试数据,使代码开发更加高效、方便。 安装 bierstadt 安装 bierst...

    3 年前
  • npm 包 polyfill-contextmenu 使用教程

    前言 在 web 开发中,右键菜单是一个非常常见的组件,但是各个浏览器的实现方式不一样,有些浏览器可能没有原生的右键菜单,因此需要引入 polyfill-contextmenu 包来解决问题。

    3 年前
  • npm 包 ember-post-robot 使用教程

    什么是 ember-post-robot? ember-post-robot 是一个 npm 包,它是一个通用的跨域通信库。这是一个强大且易于使用的库,可以用于在不同的窗口、框架和浏览器中进行通信。

    3 年前
  • npm 包 mvt-encoder 使用教程

    前言 mvt-encoder 是一个用于将 GeoJSON 数据编码成 Mapbox Vector Tile 的 npm 包。 GeoJSON 是一种常见的在地图应用中表达空间数据的格式,而 Mapb...

    3 年前
  • npm 包 curddy 使用教程

    简介 curddy是一个用于快速生成CURD模板的npm包。CURD,也就是增删改查,是在前端开发中经常用到的功能。使用curddy可以帮助我们快速生成CURD模板,提高开发效率,减少重复劳动。

    3 年前

相关推荐

    暂无文章