npm 包 archerbot 使用教程

面试官:小伙子,你的数组去重方式惊艳到我了

前言

在前端开发过程中,我们经常需要处理一些自动化的任务,比如爬取网页数据、自动提交表单等。这时候,我们就需要用到一些自动化工具了。其中,archerbot 就是一款非常优秀的 npm 包,其拥有很强的自动化能力,可以帮助我们完成许多重复且繁琐的任务。本文将详细介绍如何使用 archerbot 进行自动化处理。

安装

首先,我们需要在项目中安装 archerbot,可以使用 npm 命令进行安装。

--- ------- ------ ---------

快速入门

在安装完成后,我们就可以开始使用 archerbot 了。下面提供一个简单的示例代码:

----- --------- - --------------------

-- ------ --------- --
----- --- - --- -----------

-- -- ------ --
---------------- -- -------- ----- ------ ------- -- -
  ----- - ------- - - ------
  ----- ------------------------------------
  ----- ----------------------- --------
  ----- ----------------------------
  ----- ------------------------
--

-- ----
--------------- -- -------- - -------- ------------ --

以上代码中的 bot.task 方法用于定义一个任务。它接收两个参数:

  • 任务名称:该任务的名称,用于在运行任务时进行引用;
  • 处理函数:一个 async 函数,其参数是一个 page 对象和一组自定义参数,用于执行具体的任务。

bot.run 方法用于运行一个任务。它接收两个参数:

  • 任务名称:要运行的任务名称;
  • 自定义参数:一个对象,用于向任务传递自定义参数。

运行以上代码后,程序将自动在 Google 上搜索 JavaScript,并返回搜索结果页。

API 文档

上面的示例仅仅是 archerbot 的冰山一角。下面将详细介绍它所有的 API 接口。

实例化

首先,我们需要实例化一个 Archerbot 对象:

----- --------- - --------------------
----- --- - --- ------------------

该实例将作为整个自动化过程的基础,并提供许多方法和属性。

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • headless: 一个布尔值,表示是否以无界面模式运行浏览器。默认为 true;
  • executablePath: 一个字符串,表示浏览器可执行文件的路径。默认为 null,使用系统默认安装路径;
  • args: 一个字符串数组,用于传递命令行参数给浏览器。默认为空数组;
  • userDataDir: 一个字符串,表示用户数据目录的路径。默认为 null,使用系统默认目录。

网络请求

以下方法用于处理浏览器的网络请求:

1. bot.onRequest(handler)

用于监听所有的网络请求,并在每个网络请求的“请求开始”时触发回调函数。

------------------- ------ -------- -- -
  -------------------- --------------
--

该方法返回一个用于取消监听的函数。

----- -------------- - -------------------- -------- -- -
  -- ---
--

-- ------
----------------

2. bot.onResponse(handler)

用于监听所有的网络请求,并在每个网络请求的“响应完成”(即响应 body 下载完成)时触发回调函数。

-------------------- ------ --------- -- -
  -------------------- ---------------
--

该方法返回一个用于取消监听的函数。

----- -------------- - --------------------- --------- -- -
  -- ---
--

-- ------
----------------

3. bot.prepareRequest(handler)

用于修改所有的网络请求,比如修改请求头、添加 cookie 等。该方法在每个网络请求发出前都会被调用一次。

------------------------ ------ -------- -- -
  -------------------- --------------
  ----------------------------------- - -----------
--

该方法返回一个用于取消监听的函数。

----- -------------- - ------------------------- -------- -- -
  -- ---
--

-- ------
----------------

网页操作

以下方法用于对浏览器中的网页进行操作:

1. bot.task(name, handler)

用于定义一个新的任务,任务包含一个或多个页面操作。

----------------- ----- ------ ------- -- -
  ----- -------------------------------------
  ----- ------------------------------ ----------------
  ----- ------------------------------ ----------------
  ----- ----------------------------
  ----- ------------------------
--

该方法返回一个可用于调用任务的函数。

----- ------- - ----------------- ------ ------- -- -
  -- ---
--

-- ----
--------- --------- -------- --------- ----- --

如果要定义多步任务,可以在回调函数中调用多个页面操作。

------------------ ----- ------ ------- -- -
  ----- ------------------------------------
  ----- ----------------------- ---------------
  ----- ----------------------------
  ----- ------------------------
  ----- ----------- - ----- -------------------- --- ---
  -------------------------------- -- -------------
--

2. bot.get(url, options)

用于在浏览器中打开指定的网页。

----- -----------------------------------

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • waitLoad: 一个布尔值,表示是否等待页面的所有资源都加载完成后返回。默认为 true;
  • waitSelector: 一个 CSS 选择器,表示等待页面中指定的元素出现再返回。默认为 null。
----- ---------------------------------- -
  --------- -----
  ------------- ------------
--

该方法返回一个 Promise,其结果是一个 page 对象。

3. bot.delay(ms)

用于让程序延迟指定的时间(单位是毫秒)。

----- --------------- -- -- - -

4. page.type(selector, text, options)

用于向指定元素输入文本。

----- ------------------------------ --------
----- ------------------------------ ------

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • delay: 一个数字,表示每次输入的间隔时间(单位是毫秒)。默认为 0。
----- ------------------------------ -------- - ------ --- --

5. page.click(selector, options)

用于点击指定元素。

----- -----------------------------

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • button: 一个字符串,表示要模拟的鼠标按钮。可选值为 "left"、"right"、"middle"。默认为 "left"。
----- ----------------------------- - ------- ------- --

6. page.waitFor(selectorOrFunctionOrTimeout, options)

用于等待页面中的某个元素出现。

----- ------- - ----- ---------------------------
----- ---------------------------------

selectorOrFunctionOrTimeout 参数可以是以下三种类型的之一:

  • CSS 选择器,表示等待指定元素出现;
  • 一个或多个 CSS 选择器的数组,表示等待这些元素出现;
  • 一个回调函数,该函数返回一个布尔值,表示等待某个条件成立。

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • timeout: 一个数字,表示等待的最长时间(单位是毫秒)。默认为 30000 毫秒(即 30 秒);
  • polling: 一个数字,表示每隔多长时间(单位是毫秒)轮询一次判断条件是否满足。默认为 500 毫秒。
----- ----------------------- - -------- ----- --
-- ---
----- --- ----------------- ------- -- -
  ------------- -- -
    -- ----------------------------------- -
      ---------
    - ---- -
      --------------
    -
  -- ------
--

7. page.waitForNavigation(options)

用于等待页面跳转完成。

----- -----------------------------
----- ------------------------

options 参数是一个包含一些选项的对象,可选。以下是该对象的可用选项:

  • timeout: 一个数字,表示等待的最长时间(单位是毫秒)。默认为 30000 毫秒(即 30 秒)。

8. page.goBack()

用于后退一页。

----- -------------

9. page.goForward()

用于前进一页。

----- ----------------

10. page.reload(options)

用于重新加载页面。

----- ------------- --------- ---- --

options 参数同 bot.get 方法的选项。

11. page.evaluate(pageFunction, ...args)

用于在浏览器页面中执行 JavaScript 代码。

----- ----- - ----- ---------------- -- ---------------

第一个参数 pageFunction 是一个 stringfunction 类型,表示要在页面中执行的代码。如果该参数是一个字符串,则将其作为可执行的 JavaScript 代码。如果该参数是一个函数,则将其转换为字符串,并将其作为可执行的 JavaScript 代码。该方法支持传递任意数量的其他参数,这些参数会被传递给 pageFunction

----- ------------------------- -- -
  ------ - - -
-- -- -- -- -- -

需要注意的是,由于 JavaScript 是运行在浏览器内部,所以在 pageFunction 内部无法直接访问 Node.js 的全局变量,比如 modulerequire 等。如果要访问这些变量,需要使用 window 对象,结合浏览器插件等方式进行封装。

12. page.$(selector)

用于查找页面中的一个元素。

----- ------ - ----- -----------------------

该方法返回的是一个 Promise 对象,结果是一个 ElementHandle 对象,表示查找到的元素。如果找不到指定的元素,结果为 null

13. page.$$(selector)

用于查找页面中的所有符合条件的元素。

----- ----------- - ----- -------------------- --- ---

该方法返回的是一个 Promise 对象,结果是一个 ElementHandle 对象的数组,表示符合条件的所有元素。如果找不到任何元素,结果为空数组。

14. ElementHandle.click(options)

用于模拟点击元素。

----- ------ - ----- -----------------------
----- --------------

options 参数同 page.click 方法的选项。

15. ElementHandle.type(text, options)

用于向元素输入文本。

----- ----- - ----- ---------------------------
----- -----------------

options 参数同 page.type 方法的选项。

16. ElementHandle.press(key, options)

用于模拟键盘按键。

----- ----- - ----- ---------------------------
----- ------------------
----- ------------------------

key 参数是一个表示按键的字符串,比如 "Enter"、"ArrowLeft" 等。options 参数同 page.type 方法的选项。

总结

archerbot 是一个非常强大的自动化工具,既简单易用又功能强大。本文仅仅介绍了其大部分 API 接口,更高级的用法还需要读者自行探索。在使用过程中,需要注意合法使用,不要用于非法用途。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/90496


猜你喜欢

  • npm包json-bignum使用教程

    简介 在前端开发中,经常需要处理数据。就像你需要解析字符串为浮点数或整数,但是由于 JavaScript 的限制,它不能处理特别大的数字。如果你在处理数字方面遇到了问题,那么npm包json-bign...

    5 年前
  • npm 包 simple-lastfm 使用教程

    在前端开发中,我们经常需要使用第三方库或者工具来实现各种功能。而在 Node.js 中,我们通常使用 npm 包来方便地安装和管理这些工具。在本文中,我们将介绍一款名为 simple-lastfm 的...

    5 年前
  • npm 包 ttapi 使用教程

    本篇文章介绍如何使用 npm 包 ttapi 来进行淘宝的开放平台 API 接口调用。ttapi 是一个基于 Promise 的 Node.js 模块,支持多种接口的调用。

    5 年前
  • npm 包 ajaxcachemanager 使用教程

    什么是 ajaxcachemanager? ajaxcachemanager 是一个前端 npm 包,它是用于在浏览器端实现 ajax 缓存的工具类库。使用这个工具,你可以轻松地将 ajax 请求的...

    5 年前
  • npm 包 fa 使用教程

    在前端开发中,图标是必不可少的元素,而 font-awesome (fa) 是一个非常流行的图标库,提供了数以千计的图标选择。fa 可以使用 npm 安装,方便快捷。

    5 年前
  • npm 包 @babel/helper-fixtures 使用教程

    前言 在前端开发过程中,经常会用到 Babel 进行代码编译和转换。@babel/helper-fixtures 是 Babel 的一个辅助包,用于测试和调试 Babel 插件的一个工具库。

    5 年前
  • npm 包 node-environment-flags 使用教程

    在前端开发中,常常需要根据不同的环境来进行配置和调试,例如开发环境、测试环境以及生产环境等。而 npm 包 node-environment-flags 就是一个非常方便实用的工具,可以帮助我们快速获...

    5 年前
  • npm 包 3d-bin-packing 使用教程

    3D-bin-packing 是一款基于 Javascript 的 npm 包,用于 3D 空间内的物品装箱布局(packing)。它可以帮助前端工程师解决物品在空间内布局的问题,实现更具效率的物品摆...

    5 年前
  • npm 包 1c 使用教程

    如果你是前端开发人员,就不能不了解 npm。npm,全称 Node Package Manager,是一个由 Node.js 提供支持的软件包管理器。它允许用户在命令行中安装、更新、卸载 Node.j...

    5 年前
  • npm 包 163music-api 使用教程

    npm 包 163music-api 是一个用于从网易云音乐获取歌曲信息的 Node.js 模块。它提供了一些简单的 API,可以让开发者轻松的检索并获取到网易云音乐的歌曲数据。

    5 年前
  • npm 包 @typescript-eslint/parser 的使用指南

    在前端开发中,我们需要经常使用 TypeScript 来编写可靠且类型安全的代码。针对 TypeScript 代码的静态分析工具有很多,其中 @typescript-eslint/parser 是一个...

    5 年前
  • npm 包 @typescript-eslint/eslint-plugin 使用教程

    前言 TypeScript 是一种由微软开发的 JavaScript 超集,它增加了一些强类型和对象化的功能,让 JavaScript 开发更加可靠和容易维护。但是在 TypeScript 开发中,我...

    5 年前
  • npm 包 @types/node-fetch 使用教程

    在前端开发中,经常需要使用到 node-fetch 进行数据请求。但是,在 TypeScript 项目中使用该包时可能会出现类型错误等问题。此时,我们可以使用 @types/node-fetch 来解...

    5 年前
  • npm 包 biiif 使用教程

    前言 biiif 是一个 npm 包,它提供了 BIIIF (Browser Independent Image Interchange Format) 的支持。BIIIF 是一种基于 IIIF (I...

    5 年前
  • npm 包 @iiif/iiif-metadata-component 使用教程

    前言 IIIF 是一项互联网图像协议,旨在提高世界各地各种类型文化遗产的访问和展示。在 JavaScript 开发中,IIIF 也有一些 npm 包可以使用。本文将介绍 @iiif/iiif-meta...

    5 年前
  • npm 包 @iiif/iiif-gallery-component 使用教程

    介绍 @iiif/iiif-gallery-component 是一个基于 IIIF(International Image Interoperability Framework)协议的图像库,具备像...

    5 年前
  • NPM 包 UniversalViewer 使用教程

    UniversalViewer 是一款用于实现高交互式图片、地图、书籍等的可嵌入式 Web 阅读器的开源 JavaScript 库。它支持多语言、自由拓展,可以轻松帮助开发者完成复杂的图像处理和预览功...

    5 年前
  • npm 包 @iiif/manifold 使用教程

    简介 @iiif/manifold 是一个针对 IIIF 图像服务的 JavaScript 客户端库,用于在客户端应用程序中渲染 IIIF 图像。它提供了一组 API,可以在应用程序中展示,比较和操作...

    5 年前
  • npm 包 assert-js 使用教程

    什么是 assert-js assert-js 是一个基于 Node.js 平台的 npm 包,它为 JavaScript 开发人员提供了一个简单却有效的方法来进行断言。

    5 年前
  • npm 包 @pirxpilot/tip 使用教程

    介绍 @pirxpilot/tip 是一个轻量级的 JavaScript 库,可以在网站或应用中创建各种类型的提示框。它是基于 jQuery 和 CSS 样式的,可以自定义样式和位置,适用于不同的需要...

    5 年前

相关推荐

    暂无文章