Puppet-run 是一个基于 Puppeteer 的 Node.js 层级框架,可以用来进行无头浏览器网页测试、网页截图、爬虫和自动化 UI 测试等操作。本文将详细介绍如何使用 npm 包 puppet-run 进行常见的网页测试和爬虫操作。
安装
在使用 puppet-run 之前,需要先安装 Node.js 和 npm,可以在命令行输入以下命令进行安装:
$ curl -sL https://deb.nodesource.com/setup_14.x | sudo bash - $ sudo apt-get install -y nodejs
安装完成后,可以使用以下命令安装 puppet-run:
$ npm install puppet-run
网页测试
运行浏览器
首先,需要创建测试文件,该文件中需要引入 puppet-run 模块,并在运行浏览器前设置浏览器的一些选项。以下是示例代码:
-- -------------------- ---- ------- ----- --------- - ---------------------- ------ -- -- - ----- ------- - ----- ------------------ --------- ----- --- ----- ---- - ----- ------------------ ----- ----------------------------------- ----- ----------------- ----- ----------- --- ----- ---------------- -----
在该示例中,首先引入 puppet-run 模块,并使用 launch 方法创建一个浏览器实例。在 launch 中可以设置一些选项,例如是否启用无头模式(headless),是否禁用 gpu(args: ['--disable-gpu']),是否启用 devtools(devtools: true)等等。接着使用 newPage 方法创建一个新的页面实例,并通过 goto 方法跳转到百度首页。最后使用 screenshot 方法将页面截图保存到指定路径,close 方法关闭浏览器实例。
获取元素
在进行网页测试时,经常需要通过元素的标签、id、类名等来获取相应的元素。以下是示例代码:

在该示例中,通过 $ 方法获取页面元素,其中选择器可以是标签名、id、类名、name 等。接着使用 type 方法在输入框中输入文本,使用 click 方法模拟点击按钮,使用 waitForNavigation 方法等待页面跳转完成,最后使用 screenshot 方法保存页面截图。
爬虫
除了进行网页测试,也可以使用 puppet-run 进行爬虫操作,例如抓取网页数据等。
以下是获取百度热搜榜数据的示例代码:
-- -------------------- ---- ------- ----- --------- - ---------------------- ------ -- -- - ----- ------- - ----- ------------------ --------- ----- --- ----- ---- - ----- ------------------ ----- ---------------------------------------------------------------------------------------------- ----- ----------- - ----- --------------------- --- ----- -- - ------ -------------- -- -- ------ ---------------------- ----- ---------- ---- --- ------------------------- ----- ---------------- -----
在该示例中,首先通过 goto 方法跳转到百度热搜榜页面,使用 $$eval 方法获取页面元素,其中第一个参数是选择器,第二个参数是回调函数。在回调函数中,使用 map 方法将元素转换为一个对象数组,对象中包含标题和链接,最后将结果打印到控制台即可。
总结
Puppet-run 可以简化网页测试和爬虫等操作,提高开发效率。本文介绍了如何安装和使用 puppet-run 进行常见的网页测试和爬虫操作,并提供了示例代码作为参考,希望对大家有所帮助。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/5eedc182b5cbfe1ea0611e0e