前言
在前端开发中,我们有时需要从网站中获取数据,同时也有自己定制化业务需求,需要把自有网站的数据上传到爬虫平台进行分析。本文介绍了一个非常方便的 npm 包 webmiddle-client,能够很好的满足这些需求。
webmiddle-client 是什么?
Webmiddle-client 是一个基于 Node.js 的 npm 包,作为 webmiddle 爬虫平台的客户端,它提供了一系列 API,方便用户进行数据获取和上传,支持多种抓取模式,包括常规网页、API、动态页面等等。
安装 webmiddle-client
要开始使用 webmiddle-client,首先需要在 Node.js 环境下安装它:
npm install webmiddle-client
如何使用 webmiddle-client
1. 创建 webmiddle client 实例
使用 createClient
方法创建一个 webmiddle client 示例,并传入服务端地址和配置(如果需要):
const { createClient } = require('webmiddle-client'); const client = createClient({ serverUrl: 'https://example.com/webmiddle-server' });
2. 上传项目
执行以下命令,可以把本地的抓取脚本和其他相关文件上传到 webmiddle 爬虫平台。
-- -------------------- ---- ------- ----- - ------ - - ---------------------------- ------ -- -- - --- - ----- -------------- - ------------ ---------------------------------- ------------ ----------- --- - ----- --- - ----------------- - -----
3. 执行爬虫
使用 execute
方法可以执行上传到 webmiddle 的项目,并获取其结果。以下是一个完整的示例:
-- -------------------- ---- ------- ------ -- -- - --- - ----- ------ - ----- ---------------- ------------ ------------ ----- ------------------------ ----------- ------------------------------------------ ------- - --------- ------- --------- ---------- -- ---------------- ----- ------------ ----- --- -------------------- - ----- --- - ----------------- - -----
其中:
projectName
:上传到 webmiddle 的项目名称。urls
:要爬取的网站 URL 列表。resultsDir
:抓取结果保存的目录。params
:用于脚本的参数,在脚本内可通过getParams()
函数获取。pollingInterval
:轮询间隔时间(毫秒)。maxDuration
:最大持续时间(毫秒)。
执行完成后,将在 resultsDir
目录下生成抓取结果。
示例代码
以下是一个完整的示例代码:
-- -------------------- ---- ------- ----- - ------------- ------ - - ---------------------------- ----- --------- - --------------------------------------- ------ -- -- - --- - -- -- ------ -- ----- ------ - -------------- --------- --- -- ---- ----- -------------- - ------------ ---------------------------------- ------------ ----------- --- -- ---------- ----- ------ - ----- ---------------- ------------ ------------ ----- ------------------------ ----------- ------------------------------------------ ------- - --------- ------- --------- ---------- -- ---------------- ----- ------------ ----- --- -------------------- - ----- --- - ----------------- - -----
结语
Webmiddle-client 提供了一种简单易用的方式,能够方便地快速获取数据以及上传数据,同时支持灵活多变的抓取模式。建议在实际项目中尝试使用!
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/600671048dd3466f61ffdcec