设置 - 分页模板
什么是分页模板?

一项可以复制鼠标和键盘操作的功能。
配置几个值后可以在所有网站上使用。
新模板将持续添加。
什么是分页?
加载下一页数据最常见的方式。它由显示为数字(或字符)的页面按钮组成,您可以通过点击数字或特定按钮移动到下一页。
如果每个页面可以通过独立的 URL 直接访问,您可以使用批量提取功能。但是,
1. 当页面之间移动时 URL 不变
2. 当访问特定页面的 URL 时自动重定向到第一页
在这样的环境中,尝试使用分页模板来解决问题 🙂
分页模板是可以应用于单个任务的设置,每个单独任务大约有 10 分钟的采集时间限制。由于这个限制,如果您输入太多页面,提取可能会中途停止。此外,使用分页在采集时间内可以提取的页面数量取决于每页的数据量。
例如,在图片较多的网站 A 上,在执行时间内只能提取最多 24 页。
相反,在文字较多的网站 B 上,成功提取了最多 110 页。
换句话说,可提取范围取决于每页的数据量和结构。通常,分页模板适用于约 100 页左右的规模。
使用方法
检查分页类型
参考下面的类型分类,识别您要提取的网页的分页特征。
检查是否有用箭头(▶️)或"Next"文字表示的"下一页"按钮,以及点击该按钮时页面如何移动。按功能识别,而不是设计!

TYPE 1. 存在点击后直接移动到下一页 (1→2) 的按钮

TYPE 2. 没有直接移动到下一页的按钮,只有移动到下一组 (1→N) 的按钮

TYPE 3. 除页码外没有移动到下一页或下一组的按钮

TYPE 4. 没有页码,只有上一页/下一页按钮
让我们以网站 A 为例回顾一下步骤。

当点击页面底部分页中的"Next"按钮时,它从第 1 页直接移动到第 11 页——换句话说,移动到了下一组。我们可以从上述项目中识别此页面对应TYPE 2。
配置模板设置

A) 添加 Action Template 在设置底部的 ACTION TEMPLATE 中,点击 +ADD 按钮。此设置的显示和设计将来可能会更改,但应用方法保持不变。

B) 选择分页类型 参考步骤 1 的说明选择要应用的模板。网站 A 的情况是 Pagination Type2。

C) 输入变量 填写图片中的项目 ①、②、③。
① 重复此模板操作的次数 如果输入 5,它会重复下一页操作 5 次,提取最多第 6 页。如果想提取到第 10 页,请输入 9。
② 当前页码的 CSS 选择器值 如图片标记区域所示,右键点击网站分页中的"当前页"数字并选择它,然后参考复制和粘贴 CSS 选择器输入该值。
③ "Next"按钮的 CSS 选择器值 如图片标记区域所示,右键点击网站分页中的"Next"按钮并选择它,然后参考复制和粘贴 CSS 选择器输入该值。
输入所有项目后,点击 Add → Save 保存设置。
其他分页类型的工作方式相同。检查每种情况的分页类型,然后复制和粘贴 CSS 选择器值。
最后更新于
这有帮助吗?



