简介
npm 是一款 Node.js 包管理工具,它可以让你方便的使用已经发布的包。在前端开发中,很多时候我们需要识别出文本中的实体,如人名、地名、组织机构等,而公共实体识别可以帮助我们简化这一过程,本文将介绍如何使用 npm 包 public-entity-recognition 来实现公共实体的识别。
安装
首先,我们需要在项目中安装 public-entity-recognition,可以使用以下命令进行安装:
npm install public-entity-recognition
使用
public-entity-recognition 提供了两个主要的函数:
analyze(text: string): Promise<Entity[]>
:分析文本并返回实体列表。createRecognizer(): EntityRecognizer
:创建一个实体识别器。
使用 analyze 方法
我们可以简单地调用 analyze
方法来获取实体列表。如下所示:
const { analyze } = require('public-entity-recognition'); analyze('Microsoft was founded in 1975 by Bill Gates and Paul Allen.').then(entities => { console.log(entities); });
运行上述代码会输出以下内容:
-- -------------------- ---- ------- - - ------- ------------ ------- --------------- -------- ----- --------- - -------- -- ------ - - -- - ------- ----- ------- ------- --------- -------- ----- --------- - -------- --- ------ -- - -- - ------- ----- ------- ------- --------- -------- ----- --------- - -------- --- ------ -- - - -
使用 createRecognizer 方法
我们也可以使用 createRecognizer
方法创建一个实体识别器。实体识别器可以让我们更好地控制实体识别的过程。
const { createRecognizer } = require('public-entity-recognition'); const recognizer = createRecognizer(); const entities = recognizer.recognize('Microsoft was founded in 1975 by Bill Gates and Paul Allen.'); console.log(entities);
运行上述代码会输出以下内容:
-- -------------------- ---- ------- - - ------- ------------ ------- --------------- -------- ----- --------- - -------- -- ------ - - -- - ------- ----- ------- ------- --------- -------- ----- --------- - -------- --- ------ -- - -- - ------- ----- ------- ------- --------- -------- ----- --------- - -------- --- ------ -- - - -
深度解析
public-entity-recognition 的实现采用了机器学习算法,并使用了 Azure 自然语言处理服务。我们可以通过修改配置来自定义实体识别器的行为。
配置选项
以下是 public-entity-recognition 支持的配置选项:
language
:语言,默认为 "en".minimumScore
:实体的最小置信度,默认为 0.5。apiVersion
:Azure 自然语言处理服务的 API 版本,默认为 "v3.0-preview".subscriptionKey
:Azure 自然语言处理服务的订阅密钥。
自定义实体识别器
我们也可以使用 createRecognizer
方法来创建一个自定义的实体识别器。以下是一个简单的例子:
-- -------------------- ---- ------- ----- - ---------------- - - ------------------------------------- ----- ---------- - ------------------ ------------- ---- --------- ----- ---------------- ----------------------- --- ----- -------- - -------------------------- ------- --- --- --------- -- --- ------ ---------- ----------------------
运行上述代码会输出以下内容:
-- -------------------- ---- ------- - - ------- ----- --------- ------- --------- -------- ----- --------- - -------- -- ------ -- - -- - ------- ------- -------- ------- ----------- -------- ----- --------- - -------- --- ------ -- - - -
总结
通过上述内容,我们了解了如何使用 npm 包 public-entity-recognition 来实现公共实体的识别。我们也深入探讨了该包的实现和配置选项,并介绍了如何创建自定义的实体识别器。希望这篇文章可以帮助你在实际开发中更好地使用实体识别功能。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005668a81e8991b448e2c7d