企业版 - 自动抓取子页面

子页面提取是什么?

从列表页面的每个项目链接进入详情页面提取数据的功能。例如,可以从商品列表页面进入各商品的详情页面收集详细信息。


使用场景

  • 商品列表 → 商品详情页

  • 文章列表 → 文章全文

  • 搜索结果 → 各个页面

  • 人员列表 → 个人资料页


使用方法

1

在列表页面提取链接

首先用 Whole 或 Parts 提取包含详情页链接的列表。

确保提取选项中包含 "超链接"

2

使用群组提取

将提取的链接用于群组提取。

1

复制结果页的 URL 列

2

创建新的群组提取

3

粘贴 URL 列表

参考:群组提取

3

选择提取方式

在详情页面选择要提取的信息。

  • 使用 Whole 提取全部

  • 使用 Parts 只提取需要的部分

4

开始提取

开始群组提取,Listly 会自动访问所有详情页面并提取数据。


提示

  • 先提取少量链接测试

  • 使用代理可以提高成功率

  • 设置适当的延迟时间

  • 启用快速失败功能以避免浪费 URL


注意事项

  • 需要高级 URL

  • 详情页结构不同时可能失败

  • 建议使用自动重试功能

  • 一次提取不要超过 100 个页面


相关功能

这有帮助吗?