介绍
@tessdata/chi_sim 是一个用于 OCR( optical character recognition,光学字符识别)的 npm 包。该包提供了一个中文语言包 @tessdata/chi_sim.traineddata,可以识别中文的字符和文本。在前端开发中,当需要使用 OCR 技术时,可以考虑使用该包。
安装
可以使用 npm 进行安装:
npm install @tessdata/chi_sim
使用
使用 @tessdata/chi_sim 包,需要先下载并安装中文语言包 @tessdata/chi_sim.traineddata。在使用前,需要先加载这个语言包:
-- -------------------- ---- ------- ----- -------------- - ------------------------ ----- ------ - -------------- --------- ------------------------------------------ --------- ----------------------------------------------- ----------- --------------------------------------- ------- - -- -------------- --- ------ -- -- - ----- -------------- ----- ------------------------------- ----- ----------------------------- -- ----- -- --- -- ----- ------------------- -----
OCR 识别
使用 @tessdata/chi_sim 包进行 OCR 识别,可以通过提供图片或者图片的地址,将图片中的字符或文本识别出来。以下是一个例子:
-- -------------------- ---- ------- ----- -------------- - ------------------------ ----- ------ - -------------- --------- ------------------------------------------ --------- ----------------------------------------------- ----------- --------------------------------------- ------- - -- -------------- --- ------ -- -- - ----- -------------- ----- ------------------------------- ----- ----------------------------- -- ---- ----- ------ ------- - ----- ----------------------------------------------------------------------- -- ------ -- ----- ------ ------- - ----- ---------------------------------- ------------------ ----- ------------------- -----
总结
通过使用 @tessdata/chi_sim 包,我们可以方便地进行 OCR 技术应用。在使用前,需要先下载中文语言包 @tessdata/chi_sim.traineddata,并要正确地加载这个语言包。此外,我们还可以通过提供图片或者图片地址,进行 OCR 识别操作。
参考链接
- @tessdata/chi_sim.npm: https://www.npmjs.com/package/@tessdata/chi_sim
- tesseract.js.github: https://github.com/naptha/tesseract.js
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005624b81e8991b448df8c1