npm 包 @aws-sdk/client-textract 使用教程

阅读时长 4 分钟读完

前言

在云计算和人工智能的时代,短时间内处理大量复杂数据变得越来越重要。AWS Textract 是一个 Amazon Web Services 的机器学习服务,它可以从扫描的文档中提取文本和字符,并且可以识别表格和表单。@aws-sdk/client-textract 是 AWS Textract 的 JavaScript 集成包,它为前端和后端应用程序提供轻松访问 Textract API 的方法。本文将重点介绍如何使用该 npm 包搭建前端界面并使用 AWS Textract 服务。

安装与配置

在使用@aws-sdk/client-textract 之前,请先确保您已经安装 Node.js。在终端中,输入以下命令即可安装 @aws-sdk/client-textract:

在安装好 @aws-sdk/client-textract 后,您需要在 AWS 控制台中创建身份验证凭据并在前端应用程序中配置它们。需要注意的是,您需要提供 AWS Access Key ID 和 Secret Access Key,以及您要使用的服务区域。您可以在 AWS 管理控制台的“凭据管理”和“区域”部分找到这些信息。

接下来,我们需要导入@aws-sdk/client-textract 并配置身份验证凭据和区域:

这样我们就可以愉快的开始使用 Textract 服务了!

使用 Textract 服务

@aws-sdk/client-textract 中的 DetectDocumentTextCommand 命令可以用于从文件中检测文本内容,并将其转换为可供进一步分析的结构化数据。命令具有以下参数:

  • InputImage: 指向文本扫描图像的 S3 对象 URL。
  • Document: 包含用于处理文件的选项的 JSON 对象。
  • FeatureTypes: 要检测和提取的功能类型的列表。

例如,我们可以通过以下代码从 Amazon S3 上的图像中检测文本:

-- -------------------- ---- -------
----- -- - --------------

----- --------- - -------------------

----- ----------- - ---------------------------

----- ------ - -
  --------- -
    -- ------- ---- -- --
  --
  ------------- ---------
--

----- ------- - --- ---------------------------
  --------- -
    ------ -----------
  --
  ------------- -------------------
---

---------------------------------- -- -
  ---------------------
------------ -- -
  ------------------ -----------
---

运行以上代码可以获得一个包含检测到的文本选项的 JSON 对象。注意,在实际使用 @aws-sdk/client-textract 时,您需要根据自己的应用程序需求,参数处理方式不太一样。

总结

本文详细介绍了如何使用 @aws-sdk/client-textract 这个 npm 包,以便在您的前端应用程序中轻松访问 AWS Textract API。它为从图像中提取文本和字符提供了一个强大和易于使用的解决方案。尽管这只是 @aws-sdk/client-textract 的一个简单示例,但它为您提供了一些指导和灵感,希望它能对您的应用程序开发有所帮助!

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/5f6f483ba9b7065299ccba64

纠错
反馈