npm包keyword-extractor使用教程-JavaScript中文网-JavaScript教程资源分享门户

介绍

keyword-extractor是一个JavaScript模块，可以提取一段文本中的关键词。它是一个开源的npm包，可以通过npm安装。它的优点在于它可以识别常用语言中的常用词汇，并忽略文章中的停用词，从而准确提取关键词。

在用户进行搜索或者自然语言处理等场景中，提取关键词是一项基本的需求。而keyword-extractor可以帮助我们快速有效的实现这一目的。

安装

要使用keyword-extractor，需要先安装它。可以使用npm进行安装。

npm install keyword-extractor

使用

安装完成之后，就可以在JavaScript项目里面使用keyword-extractor。下面是一个使用示例。

首先导入模块：

const keywordExtractor = require('keyword-extractor');

然后，可以调用它的extract方法提取关键词。extract方法接收一个字符串参数，代表需要提取关键词的文本。它返回一个提取出的关键词数组，每个元素就是一个关键词。这里使用给定的文本作为例子：

const text = "今天是星期五，天气很好，我们去公园游玩。";
const result = keywordExtractor.extract(text);
console.log(result);

运行以上代码，控制台输出：

['星期五', '天气', '公园', '游玩']

可以看到，方法成功提取了以上4个词作为文本的关键词。

API

keyword-extractor模块提供的API如下：

extract

extract方法接收一个字符串参数，代表需要提取关键词的文本。它返回一个提取出的关键词数组，每个元素就是一个关键词。其语法如下：

keywordExtractor.extract(text, options = {});

text：必填参数，代表需要提取关键词的文本。
options：可选参数，一个包含配置项的对象，可通过配置它来影响提取结果。

options对象可以包含以下属性：

language: 可选参数，指定文本的语言类型，默认为英文。当前支持的语言包括英文、中文、法语和荷兰语。
remove_digits: 可选参数，是否移除数字，默认为true。
remove_duplicates: 可选参数，是否移除重复的关键词，默认为false。
return_changed_case: 可选参数，是否返回统一小写的关键词，默认为false。

语言支持

keyword-extractor支持多种语言。目前，它支持的语言包括：

英文
中文
法语
荷兰语

你可以通过在options对象中指定language属性来切换语言：

const options = {
  language: 'zh' // 切换到中文
};
const result = keywordExtractor.extract(text, options);

例子

下面举一个更复杂的例子，使用keyword-extractor提取一个网页中的文本的关键词。这里我们将使用一个名为Node.js的模块request，先通过它获取网页的HTML内容，然后再利用cheerio模块对HTML进行提取。

-- -------------------- ---- -------
----- ------- - -------------------
----- ------- - -------------------
----- ---------------- - -----------------------------

-- ---------
--------------------------------------------------- ------- --------- ----- -- -
  -- ------- -- ------------------- --- ---- -
    -- -------------
    ----- - - -------------------
    -- -----------
    ----- ----- - ------------------
    -- ------
    ----- ---- - -----------------
    -- -----
    ----- ------ - -------------------------------
    --------------------
  -
---展开代码

输出结果如下：

['functional', 'W3C', 'delegates', 'domains', 'Scripts', 'featured', 'parametrizes', 'naming', 'able', '2D', 'compatibility', 'modifier', 'inclusion', 'int', 'modification', 'conditional', 'literals', 'Notable', 'lengths', 'RFCs', 'checked', 'routines', 'Futures', 'Self', 'inlined', 'browsers', 'functions', 'end',...]

以上代码利用了request模块获取了一个网页的HTML内容，并利用cheerio提取其中的文本内容。最后，它将text传递给keyword-extractor提取关键词，并将结果输出到控制台。

总结

这篇文章介绍了npm包keyword-extractor的使用。通过本文，大家可以掌握一个识别文本中的关键词的工具，并且可以灵活配置来达到自己的需求。在实际应用中，只要用到关键词的场景都可以考虑使用它。我们希望这篇文章能够对读者有所帮助。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/5ef9f768403f2923b035ba34

npm包keyword-extractor使用教程

介绍

安装

使用

API

extract

语言支持

例子

总结

纠错反馈

程序员教程

程序员面试题库