npm 包 crawler-dashboard 使用教程

前言

现如今,爬虫已经成为了非常普遍的一个应用场景,很多人都会用各种语言来写爬虫,因此在这里,我们介绍用 JavaScript 模块化工具 npm 来进行爬虫的操作。

crawler-dashboard 正是一个基于 NodeJs 的爬虫库,本文将详细介绍 npm 包 crawler-dashboard 使用教程。

安装

在本地项目路径下运行以下命令行:

--- ------- -----------------

或者,在 package.json 的依赖列表中添加:

-
  --------------- -
    -------------------- --------
  -
-

然后执行:

--- -------

即可安装。

使用

  1. 导入依赖

在项目中,需要引入两个依赖:

----- ---------------- - ----------------------------------------------
----- ------- - -------------------

其中,CrawlerDashboard 基于 Express.js,因此需要引入 express,以及基于 request 的爬虫模块 Crawler。

----- ------- - -------------------
----- ------- - -------------------
----- ---------------- - ----------------------------------------------
----- --- - ----------
----- ------- - --- ----------
----- --------- - --- ------------------
    ----- -----
    -------- -------
---
  1. 设置基本配置项

在调用 CrawlerDashboard 的构造函数时,我们需要设置基本参数项:

----- --------- - --- ------------------
    ----- ----- -- -----
    -------- --------
    --------- -- -- ------
    ------------ ----- -- ------
    --------------- --- -- -----
    ------ ---- -- ---------
---
  1. 开始爬虫
---------------- -------- -- -
    ------------------- ------- -- ---- --------
    ------------------
---

这时,在浏览器中打开 http://localhost:8080/ 即可访问爬虫仪表板。

教程

crawler-dashboard 提供丰富的爬虫展示信息和操作,可以很方便的监控数据和前端界面进行爬虫操作。

在爬虫运行时,crawler-dashboard 会自动记录上下文,因此可以很方便的暂停和恢复爬虫。

crawler-dashboard 提供了以下操作:

  • 暂停和恢复爬虫:在爬虫运行中,可以通过点击页面中的暂停和继续按钮来停止和恢复爬虫的运行;
  • 删除已经爬取的 url:新添加的url尚未被爬取,可以通过选中并点击 delete 按钮来删除已爬取的 url;
  • 添加目标 url:通过添加目标 url 来增加待爬取的 url,点击 add 按钮来确认添加。

crawler-dashboard 根据爬取的 url 地址自动生成爬虫树,可以通过爬虫树来查看爬虫进度和结构。

示例代码

----- ------- - -------------------
----- ------- - -------------------
----- ---------------- - ----------------------------------------------
----- --- - ----------
----- ------- - --- ----------
----- --------- - --- ------------------
    ----- -----
    -------- -------
---

------------------------ ------------------- --------- ----

-------------------------- ------------------- -------------------- ----

---------------------------- ------------------- ----

------------------------------ ------------------- ---------- ----

--------------------------- ------------------- --------------- ------------ ----

--------------------------- ------------------- ---------- --------- ----

---------------------------- ------------------- --------- ----

-------------------------- ------------------- --------- ----

------------------------ --------------- -------- ----

---------------------- ------------------- -------- ----

------------------- ---------- ----

---------------- -------- -- -
    ------------------- ------- -- ---- --------
    ------------------
---

结论

crawler-dashboard 是一款前端开发必备的爬虫监控工具,无论你是初学者还是职业开发者都可以轻松上手,建议大家多加尝试。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/60055b1681e8991b448d8c1f


猜你喜欢

  • npm 包 monkeywang-simditor 使用教程

    一、前言 随着互联网的发展,web 前端技术越来越重要,也越来越深入。其中,npm 包是前端开发必备的工具之一,它可以帮助我们实现代码复用、提升开发效率、提高代码质量等等。

    2 年前
  • npm 包 wechat2alipay 使用教程

    微信与支付宝是两个常用的移动支付平台,开发人员需要对两个平台分别进行开发和测试相关的功能。为了方便开发人员进行跨平台的开发,npm 包 wechat2alipay 应运而生。

    2 年前
  • npm 包 xy-aos 使用教程

    什么是 xy-aos xy-aos 是一款前端动画库,它能够帮助你制作出各种炫酷的页面动画效果。使用 xy-aos,你可以快速地为你的网站或者 Web 应用添加各种现代化的动画效果,为用户带来更好的体...

    2 年前
  • npm 包 @iamstarkov/theming-issue-5 使用教程

    在前端开发过程中,常常需要设计各种主题。通常情况下,为了保持一致性,整个应用程序的颜色组合需要保持一致。为此,我们需要使用一些工具来管理和切换主题。其中,@iamstarkov/theming-iss...

    2 年前
  • npm 包 php-ngserver 使用教程

    随着前端技术的不断发展,前后端分离成为了趋势,前端开发人员需要掌握一定的后端技能才能更好地发挥自己的作用。而 php-ngserver 这个 npm 包可以帮助前端开发人员快速搭建后端开发环境,提高开...

    2 年前
  • npm 包 log-err 使用教程

    介绍 在编写前端代码时,我们都会遇到错误,常常需要调试程序来寻找错误原因。此时,一个好用的错误日志工具就能够为我们提供很大的帮助。本文将介绍 npm 包 log-err,一个轻量易用的前端错误日志工具...

    2 年前
  • Iced-Cooffee-Script-2 的使用教程

    概述 Iced CoffeeScript 是一个 JavaScript 的超集,它能够让你在 JavaScript 的基础上写出更精炼、更优雅的代码。同时,Iced CoffeeScript 也基于 ...

    2 年前
  • npm 包 lazy-arr 使用教程

    在前端开发中,我们经常需要处理数组数据。而有时候,这个数组可能会非常大,如果在一次性将所有数据加载到内存中,会使得程序变得非常卡顿,甚至因为内存不足而崩溃。为了解决这个问题,我们可以使用一个名为 la...

    2 年前
  • npm 包 sd-swim 使用教程

    什么是 sd-swim sd-swim 是一个基于 SWIM 协议的集群管理工具,它可以提供节点间的健康检查、成员列表维护和故障恢复等功能。它是一个 npm 包,可以在前端项目中使用。

    2 年前
  • npm 包 miniplugin 使用教程

    介绍 miniplugin 是一个基于 webpack4 的简单 JavaScript 插件库。它可以用于编写 webpack 插件,可以拓展 webpack 的编译过程,实现自定义的功能。

    2 年前
  • NPM包node-sdl-speaker使用教程

    引言 在前端应用程序的开发中,我们有时需要使用到音频播放器以及音频控制功能。在这种情况下,我们可以使用NPM包node-sdl-speaker来完成这种音频处理的需求。

    2 年前
  • npm包couliris的使用教程

    什么是npm包couliris? npm包couliris是一个用于前端开发的UI组件库,提供了丰富的组件和样式,能够帮助开发者快速搭建漂亮的页面。 安装和使用 安装npm包couliris很简单,只...

    2 年前
  • npm 包 giraffy 使用教程

    简介 giraffy 是一个用于前端开发的 npm 包,提供了一系列常用的工具函数和组件等,可以帮助开发者更加便捷高效地进行 Web 开发。 安装 在使用 giraffy 之前,首先需要安装 gira...

    2 年前
  • npm 包 ng-highlight 使用教程

    在前端开发中,我们有时需要将代码高亮显示。如果使用纯手工方式,可能会比较耗时且重复劳动。 在这种情况下,我们可以使用现成的 npm 包例如 ng-highlight 来解决这个问题。

    2 年前
  • npm 包 5000chou-yen-hoshii 使用教程

    前言 在日常前端开发中,我们经常需要实现一些特殊效果或功能。此时,借助现有的 npm 包能够有效简化我们代码开发的难度和复杂度。本文将介绍一个有趣的 npm 包 —— 5000chou-yen-hos...

    2 年前
  • npm 包 cs-common 的使用教程

    介绍 在前端编程中,我们经常需要使用许多第三方库来提高我们的代码效率和可维护性。其中,npm 是最流行的包管理器之一,提供了丰富的开源组件。 在本教程中,我将为您介绍一个非常有用的 npm 包,即 c...

    2 年前
  • npm 包 react-contextmenu-component 使用教程

    React-ContextMenu-Component 是一个 React.js 插件,可以帮助开发人员构建强大而美观的上下文菜单。它提供了一种简单的方法来创建定制的上下文菜单,并与应用程序的组件进行...

    2 年前
  • npm包hqy-lazyload使用教程

    在现代web开发中,优化网站性能是重要的一部分。当页面中存在大量的图片时,网页的性能往往会受到影响。一个解决的办法就是采用图片懒加载(lazyload)的技术。图片懒加载能有效的减轻网页的加载负担,提...

    2 年前
  • NPM 包 eslint-config-adorsys 使用教程

    介绍 eslint-config-adorsys 是一款用于 Frontend 项目的 eslint 配置包,它提供了一套规范的代码检查规则。 在前端开发中,良好的编码习惯和规范可以帮助我们编写出更优...

    2 年前
  • npm 包 exmldom 使用教程

    在前端开发中,我们经常需要对 XML 数据进行操作处理。exmldom 是一个 Node.js 模块,用于对 XML 数据进行 DOM 操作。本文将详细介绍 exmldom 的安装和使用方法,并附带示...

    2 年前

相关推荐

    暂无文章