npm 包 @tessdata/est 使用教程

阅读时长 3 分钟读完

前言

随着计算机视觉领域的不断发展,OCR 技术也日趋成熟。OCR 技术可以将图片中的文字信息转化为文本数据,方便进行文本处理。@tessdata/est 是一个 Node.js 库,主要用于将图片中的文字信息转换为文本数据。本文就将为大家介绍如何使用 @tessdata/est 包。

安装

首先你需要安装 Node.js 环境,如果你还没有安装,请前往官网进行下载安装:https://nodejs.org/

完成 Node.js 安装之后,我们就可以使用 npm 工具来安装 @tessdata/est 包了。打开终端并输入以下命令以安装:

安装完成之后,就可以在项目中引入 @tessdata/est 库了。

使用

初始化

为了能够初始化 @tessdata/est 包,我们需要通过下面这行代码来引入它:

引入之后,我们就可以使用 TesseractWorker 类来初始化 @tessdata/est 包。TesseractWorker 类可以接收一个配置对象,该对象中包含了以下几个属性:

  • lang:需要识别的语言类型,例如 'eng' 表示英语;
  • tessdata:包含要加载的语言数据的目录路径;
  • workerPath:Tesseract.js 工作线程的位置。

下面是一个基本的配置示例:

加载图片

当我们初始化 TesseractWorker 之后,就可以使用 .recognize() 方法来加载需要识别的图片了。.recognize() 方法需要传入一个路径参数,该路径参数指向要加载的图片路径:

result.text 属性是一个识别结果字符串,可以通过打印 result.text 来查看识别结果。

附加参数

除了基本的配置之外, @tessdata/est 还支持传入一些附加参数来优化识别效果。下面是一些支持的附加参数:

  • psm:Page Segmentation Mode,指定 OCR 使用哪种分割模式,默认值为 3,表示按照行排列的文本块;
  • oem:OCR Engine Mode,指定 OCR 使用哪种引擎,默认值为 3,表示使用 LSTM+Tesseract 组合引擎。

示例代码如下:

结语

通过本教程,我们学习了如何使用 @tessdata/est 包来进行 OCR 技术的开发。@tessdata/est 包非常易用,只需要传入图片路径即可进行文本识别。在实际开发中,还可以通过传入附加参数来优化识别效果。我们希望这篇文章能够对大家在 OCR 技术的学习和开发中提供有帮助的指导。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005625281e8991b448df8f5

纠错
反馈

纠错反馈