npm 包 textractor-wrapper 使用教程

1. 简介

textractor-wrapper 是一个开源的 npm 包,用于提取 PDF、Word、Excel、PowerPoint、HTML 等文件中的文本,并根据文件类型进行不同的解析。

该包是基于 textract 这个包的封装,对其进行了一些优化和拓展。

2. 安装

使用 npm 安装 textractor-wrapper 十分简单:

--- ------- ------------------

3. 使用

textractor-wrapper 提供了 extract 方法,可以用来提取文件中的文本。

----- ---------- - ------------------------------

---------------------------- -------- ----- ----- -- -
  -- ----- -
    -------------------
  - ---- -
    ------------------
  -
---
  • filepath: 待提取文本的文件路径,必填项。

  • options: 选填项。包括两个关键属性:

    • preserveLineBreaks: 是否保留文本中的行末换行符,类型为布尔值,默认为 false
    • type: 待提取文本的文件类型,类型为字符串。如果不填该属性,将根据文件扩展名自动判断文本类型。当前支持的文本类型包括 pdfdocxxlsxpptxhtml
  • callback: 回调函数,必填项。当文本提取成功时,将返回文本内容,否则返回错误信息。

4. 示例

这里提供一个使用示例:

----- ---------- - ------------------------------
----- -------- - ----------------------

----- ------- - -
  ------------------- -----
  ----- ------
--

---------------------------- -------- ----- ----- -- -
  -- ----- -
    -------------------
  - ---- -
    --------------------------------
  -
---

在上面的示例中,我们提取了一个 PDF 文件中的文本,并保留了其中的行末换行符。

5. 总结

textractor-wrapper 提供了一个简单易用的方法,用于从多种文件类型中提取文本。通过 options 参数,我们可以灵活地控制文本提取的方式。无论是提取电子书的内容,还是从 PDF 报告中摘取摘要,都可以借助该包轻松完成。

如果您对该包有兴趣,可以访问 textractor-wrapper 了解更多信息,并参与到它的开源项目中。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6006733e890c4f72775835d9


猜你喜欢

  • NPM 包 essh-medium-draft 使用教程

    在前端开发中,富文本编辑器是不可或缺的一个工具。essh-medium-draft 是一个基于 Medium 编辑器的 React 富文本编辑器,提供了许多可定制的功能。

    4 年前
  • npm 包 test-npm-pack03 使用教程

    什么是 npm 包? npm,即 Node Package Manager,是 Node.js 的包管理器。npm 能够方便地将代码包、组件、工具等发布和分享给其他开发者使用。

    4 年前
  • npm 包 mlproj-core 使用教程

    概述 npm 是世界上最大的软件库之一,其中包含了成千上万的开源代码包,包括许多前端开发工具和库。mlproj-core 是一种用于机器学习的 npm 包,可以用来管理机器学习项目的结构和依赖。

    4 年前
  • NPM 包 React-Runner-Buble 使用教程

    在前端开发中,使用第三方库和插件可以显著提高开发效率和代码质量。NPM(Node Package Manager)是前端中使用最广泛的包管理工具之一。而 React-Runner-Buble 就是一个...

    4 年前
  • npm 包 react-runner 使用教程

    最近,React 开发团队推出了一款新的 npm 包 —— react-runner。这是一个非常强大的工具,可以帮助前端开发者实现更高效的组织和管理他们的代码。 React-runner 能够自动化...

    4 年前
  • npm 包 react3dtagcloud 使用教程

    前言 react3dtagcloud 是一款基于 React 的 3D 标签云库,可以为用户提供一种全新的标签列表展现方式。其实现主要基于 Three.js 库,并配备了一些可自定义的配置选项,如字体...

    4 年前
  • npm 包 Scoped-Model 使用教程

    前言 在前端开发中,状态管理一直是一个重要的问题。在 React 中使用 Redux 或者 Mobx 等状态管理工具是比较常见的方式。但是,对于一些小型的项目或者组件库,使用状态管理工具显得有点过度,...

    4 年前
  • npm 包 @lollipop-onl/vuekey 使用教程

    前言 Vue.js 是一个流行的前端框架,广泛应用于开发现代化 Web 应用程序。在 Vue 应用的开发过程中,处理表单数据是必不可少的。我们通常使用 v-model 指令来绑定表单输入元素的值,但有...

    4 年前
  • npm 包 ttimg 使用教程

    简介 ttimg 是一款前端开发常用的 npm 包,它可以帮助我们优化图片加载流程,减小图片文件大小,提升网站性能体验。本文将详细介绍如何使用 ttimg 包。 安装 使用 npm 安装 ttimg,...

    4 年前
  • npm 包 serverless-plugin-api-cache 使用教程

    前言 当前,随着现代Web应用越来越复杂,前端开发人员需要掌握的知识点也越来越多,其中依赖管理和构建工具的掌握就成为了必须要掌握的技能之一。在前端开发过程中,我们经常会进行构建、打包、压缩等操作,而n...

    4 年前
  • npm 包 expo-version-cli 使用教程

    简介 展望未来,移动端应用程序开发一定会越来越流行。JavaScript 作为前端开发语言,已经具备了走向移动端开发的能力。React Native,Ionic 等开发框架的出现,更是加速了 Java...

    4 年前
  • npm 包 labelmore-plugin-adas 使用教程

    在前端开发中,我们常常需要对图片进行标注。这时,我们可以使用 npm 包 labelmore-plugin-adas 来实现图片标注。本文将详细介绍如何使用该包来实现图片标注。

    4 年前
  • npm 包 skybase-tools 使用教程

    背景 随着前端开发工具的不断发展,一款简单易用的工具就显得尤为重要。skybase-tools 就是这样一款工具,它能够帮助前端开发者快速搭建工程开发环境,包括项目初始化、自动化构建等等。

    4 年前
  • npm 包 create-react-email 使用教程

    介绍 create-react-email 是一个基于 React 的 npm 包,它可以帮助我们快速地创建发送邮件的模板。使用 create-react-email,我们可以避免手动编写 HTML,...

    4 年前
  • npm 包 xax-component 使用教程

    前言 在前端开发中,我们不仅需要使用大量的框架和库,还需要有一些合适的 UI 组件来构建前端页面。但是,为了提高开发效率和质量,我们不能一味地自己造轮子,这时候使用开源的组件库就显得尤为重要。

    4 年前
  • npm 包 @devneko/react-treebeard 使用教程

    一、背景 在前端开发中,展示树状结构的数据是非常常见的需求。为了方便快速地实现这一功能,我们可以使用 React 专属的树形组件库,例如 @devneko/react-treebeard。

    4 年前
  • npm 包 @progresso/openapi-typescript-client-api-generator 使用教程

    简介 @progresso/openapi-typescript-client-api-generator 是一款 TypeScript 客户端 API 生成器,用于根据 OpenAPI 规范生成客户...

    4 年前
  • npm 包 test-npm-pack02 使用教程

    前言 npm 是一个常用的 JavaScript 包管理器,通过 npm 可以方便的管理依赖、发布自己的包等。在前端开发中,经常需要使用第三方库来简化开发过程。而在使用第三方库时,我们需要先将其安装到...

    4 年前
  • npm 包 scra-pi-super 使用教程

    Scra-pi-super 是一个使用 Node.js 开发的 Web 爬虫库,它使用了 Puppeteer 库来模拟浏览器操作,可以在前端领域方便地进行数据爬取和页面截屏等任务。

    4 年前
  • npm包react-native-gizwits-audio-record使用教程

    前言 在React Native开发中,音频录制是常见需求之一,但是React Native自身并没有提供相关的API。因此,我们需要借助第三方npm包来实现录制音频功能。

    4 年前

相关推荐

    暂无文章