npm 包 @tessdata/chr 使用教程

前言

OCR 技术(Optical Character Recognition,光学字符识别)已经变得越来越成熟。Tesseract 是一个开源的 OCR 引擎,支持多种语言,同时也是 Google 的一个项目。在 Tesseract 的使用中,需要使用到其字库,而 @tessdata/chr 包提供了中文的字库文件。

本文将介绍如何使用 npm 包 @tessdata/chr,以便在 Tesseract 中成功识别中文字符。

步骤

安装 @tessdata/chr

要在 Tesseract 中使用中文 OCR,需要事先安装好需要的字库文件。 @tessdata/chr 这个npm包提供了中文汉字字库,所以我们可以直接使用该包从 npm 安装。

--- ------- -------------

引入字库文件

安装完成后,需要在 Tesseract 的配置中配置字库文件地址,以能够成功加载字库。在以下示例代码中,我们使用 node-tessocr 这个库来在 node.js 中使用 Tesseract。

-- ----
----- ------- - ------------------------
----- ---- - ----------------

-- --- ---------
----- ------- - --- ---------
  ----- ----------
  ------------- -------------------- ----- -----------------------------
---

-- --------
---------------------------------- - ------ ---- -------------- -- -
  -------------------------
---

在上面的代码中,我们通过 path.join(__dirname, '..', 'node_modules/@tessdata/chr') 找到了字库文件的路径。我们在初始化 TessOcr 类时,将字库文件路径传递给了 tessdataPath 参数。

识别结果

在成功运行上述代码后,会输出图片中识别到的中文字符。示例中使用的图片如下:

运行结果如下:

------

总结

安装并使用 npm 包 @tessdata/chr 使得实现中文 OCR 更加容易。请注意,Tesseract 字库只提供了基本的识别能力,并不能保证完全正确的识别结果。如需要更高的识别率,请使用商业 OCR 服务或和其他 OCR 引擎配合使用。

参考文献

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6005624b81e8991b448df8c3


猜你喜欢

  • npm 包 @tessdata/dan 使用教程

    什么是 @tessdata/dan @tessdata/dan 是一个基于 TensorFlow.js 的工具包,用于进行数字字符串转换。它依赖于一个训练好的模型,可以将手写的数字字符串转换成相应的数...

    3 年前
  • npm 包 @tessdata/deu_frak 使用教程

    在前端开发中,我们可能会用到 OCR 技术,它能将图片中的文字转换为计算机可以识别的字符,帮助我们更好的实现一些文本相关的功能。而 @tessdata/deu_frak 就是一个在 OCR 中较为常见...

    3 年前
  • npm 包 @tessdata/cat 使用教程

    如果你是一名前端开发者,想要在项目中实现文字识别功能,那么 @tessdata/cat npm 包就是你的不二之选。本文将由浅入深地介绍如何使用该 npm 包来实现文字识别功能的实现步骤,并提供详细的...

    3 年前
  • npm 包 @tessdata/dan_frak 使用教程

    @tessdata/dan_frak 是一个 Node.js 库,它提供了一种将文本转换为丹尼斯·弗拉卡体(Dan Frak)字形的方法。在前端开发中,有时需要将文本转换为图片或其他形式的视觉展现,此...

    3 年前
  • npm 包 @tessdata/dzo 使用教程

    在前端开发中,文字的识别与处理是一个常见的需求,而 OCR (Optical Character Recognition,光学字符识别) 是一种可用于实现文字识别的技术。

    3 年前
  • npm 包 @xxx-trends/react-cognito 使用教程

    前言 在前端开发中,身份验证和授权是很重要的一部分。AWS Cognito 是一项广泛使用的身份验证和授权解决方案,可以用于 Web 应用程序和移动应用程序。 这篇文章将介绍如何使用 @xxx-tre...

    3 年前
  • npm 包 types.leaflet.heat 使用教程

    前言 在前端开发中,经常需要使用地图相关的插件和库。Leaftlet 是一款开源的 JavaScript 地图框架,它提供了良好的交互和可定制性。Leaflet 的 Heatmap 插件可以让我们在地...

    3 年前
  • npm 包 style-pirate 使用教程

    前言 在前端开发中,我们经常需要开发一些样式炫酷的项目,这时候我们需要借助一些 CSS 框架,但是有时候这些框架会让我们的样式显得非常普通,为了解决这个问题,我们可以使用 npm 包 style-pi...

    3 年前
  • npm 包 @repositories/redis 使用教程

    简介 Redis 是一款高性能的开源键值存储数据库。它可以用作缓存、消息队列、任务队列等用途。在前端开发中,我们可以使用 Redis 进行数据缓存、消息传递等操作。

    3 年前
  • npm 包 autoalign 使用教程

    自从前端项目的管理工具 npm 出现以来,它为我们开发者提供了非常便利的方式来管理和分享代码。而 autoalign 就是一个非常实用的 npm 包,它可以帮助我们自动格式化和对齐我们的代码,让代码看...

    3 年前
  • npm 包 ctr 使用教程

    在前端开发中,我们经常使用各种 npm 包来提高开发效率和代码可维护性。今天,我们来介绍一个非常实用的 npm 包 ctr,它可以帮助我们更方便地管理样式和样式类。

    3 年前
  • npm 包 middleware-cache 使用教程

    在前端的开发过程中,我们经常需要使用缓存来提高网站的访问速度和性能。然而,手动管理缓存是一项繁琐的任务,因此,我们可以使用 middleware-cache npm 包来简化这个过程。

    3 年前
  • npm 包 rx-pubsub 使用教程

    npm 包 rx-pubsub 使用教程 在前端开发中,基于事件驱动的架构是非常常见的,PubSub 就是其中一种机制。RxJS是一个强大的事件处理库,rx-pubsub是一个基于RxJS实现的Pub...

    3 年前
  • npm 包 uls-haiku-pwd 使用教程

    前言 在现代的前端开发中,使用 npm 已经成为了必不可少的一部分。npm 的使用不仅能够方便的管理项目中的依赖和资源,还能够让我们轻松的分享自己编写的模块或代码,让其受益于更广泛的社区。

    3 年前
  • npm 包 @fuzeman/babel-plugin-module-resolver 使用教程

    介绍 在使用前端框架进行开发时,不可避免地会遇到很多的路径问题。例如,使用相对路径去引入某一个资源文件可能会导致路径过长且容易出错。这时候,使用 @fuzeman/babel-plugin-modul...

    3 年前
  • npm包 @sugarcrm/thorn 使用教程

    介绍 @sugarcrm/thorn是一个基于TypeScript开发的快速开发框架,它提供了诸如路由、中间件、请求处理等常用功能。本文将介绍如何使用该框架搭建一个基本的Web应用程序。

    3 年前
  • npm 包 generate-hekyll 使用教程

    在前端开发的过程中,我们经常需要使用到静态网站生成工具,比如 Jekyll。Jekyll 是众所周知的一个十分优秀的静态网站生成框架,它能帮我们生成整洁美观、易于维护的静态网站。

    3 年前
  • npm 包 pickle-rick 使用教程

    前言 在前端开发过程中,我们通常需要使用各种各样的第三方库和插件来提高我们的工作效率。而 npm(Node Package Manager)便是一个用于管理和分享 JavaScript 代码的工具,因...

    3 年前
  • npm 包 cordova-md-nfc 使用教程

    什么是 cordova-md-nfc? cordova-md-nfc 是一个基于 Cordova 的 NFC 插件封装,专门用于移动 Web 应用的 NFC 功能开发。

    3 年前
  • npm 包 moment-period 使用教程

    moment-period 是一个开源的 npm 包,它可以轻松地将时间区间进行处理,使时间的计算、展示和解析变得更加高效和简单。该包收集了 moment.js 操作特定的时间区间的所有方法,并将它们...

    3 年前

相关推荐

    暂无文章