此博客仅为我业余记录文章所用,发布到此,仅供网友阅读参考,如有侵权,请通知我,我会删掉。
web scraper 是一个可以进行网页数据采集的工具 ,特别适合非编程人员使用,因为上手快,还不用编写代码。只需要通过鼠标点点点,即可完成数据采集。
可能现在你还不需要数据采集,By the way,多学一门技术,总是没错的!
本篇文章内容与上一篇 【无代码爬虫】web scraper 之 采集单个内容 大致相似,区别在采集多个内容时候需要新建一个
Element,再从Element里边去采集数据。而单个内容采集无需新建Element就可以采集数据。
这里主要分两步走:
这里使用我在CSDN的主页作为展示,https://blog.csdn.net/weixin_45081575?type=blog
可以看到现在共有30篇文章,那接下来我要使用 web scraper 去采集该30篇文章的标题 和 简介(因为本文是采集多个内容

有了上篇文章的基础后,这次再来使用使用
web scraper就简单多啦。
这一大步中,分了几个小步,如下:
新建Element,再从Element里采集下面来逐一讲解。
看动图~

步骤如下:
F12 或者 鼠标右键 -> 检查,即打开开发者工具web scraper,然后选择 Create SitemapSitemap name 的位置 输入csdn(可随意更改Start URL 输入需要采集的数据的网址Create Sitemap这一步是与上一篇文章最大的不同点。
个别参数
| 选项 | 释义 |
|---|---|
| Id | 选择器的名称 |
| Seletor | 指定需要采集的数据 |
| Multiple | 如果需要采集多条数据,就勾选它 |
步骤如下:
Add new selector,即 添加选择器Id(随意写Element,需要注意的是:选择包裹着整个文章信息的框)。点击 Seletor -> Select,然后将鼠标移动到框选整个文章的位置并点击,再点击框选第二个文章的位置。选择大于等于2个文章框选之后,web scraper 会为我们匹配上整个页面中所有的文章框选。Selecting DoneMultiple 了Save selector到这一步,就开始指定需要采集的数据。先添加一个 采集文章 标题的。

再添加一个采集文章 简介的

步骤如下:
Element,Add new selector,即 添加选择器IdSeletor -> Select,然后将鼠标移动到文章标题或简介的位置并点击Selecting DoneMultipleSave selector
步骤如下:
Sitemap csdn -> Scrape -> Start scraping,即可开始数据采集refresh,可以进行刷新,看数据采集是否成功
步骤如下:
Sitemap csdn -> Export data,即可导出数据xlsx 和 csv 格式关于web scraper 的采集多个内容就到这里结束啦!下篇文章将 web scraper 采集对象属性。
有任何问题,请自行解决。