设置 - 日志批量提取 - 空白单元格
什么是日志批量提取?
这是一项用于一次性下载多次提取(每小时、每天)所采集信息的功能。当您对同一页面提取两次以上时会创建日志。使用此功能可以将过去的数据汇编到单个 Excel 表格中。
如果日志批量提取期间出现空白单元格,请尝试更换源数据并重新提取。
使用方法
https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=코로나https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=%EC%BD%94%EB%A1%9C%EB%82%98

我已经从这个页面采集数据大约 7 个月了。
采集期间:2020年8月19日 ~ 2021年3月8日
每天下午4点自动采集
共 204 条日志记录(从开始到现在 7 个月后全部成功提取)
网页设计在 2020年11月1日 突然发生了变化。请记住这个日期,因为它成为下面提取日志数据的参考点。
截至 2021年3月8日,我想把所有过去的数据汇总在一起。我将把所有内容整理到一个 Excel 表格中。这与批量提取的工作方式相同。Excel 输出会根据您选择哪个数据作为源而有所不同。
从 204 条记录中选择要作为源使用的数据结果 → 下载日志 Excel



选择最新(第 204 条)数据作为源
我将使用最近采集的第 204 条数据作为源进行提取。第 204 条数据出现在 Excel 的顶部,其余按采集时间升序出现。第 204 条数据在顶部意味着我将其用作参考来查找和整理具有相同模式的数据。
第一张图片清楚地显示了许多空白单元格。有空白单元格的日期和有数据的日期如下:
有空白单元格的采集日期范围:2020年8月19日 ~ 2020年10月31日
有数据的采集日期范围:2020年11月1日 ~ 2021年3月7日
为什么?因为作为日志批量提取源,选择了 2021年3月8日 的数据结果。此数据与 2020年11月1日 ~ 2021年3月7日 采集的所有数据格式相同——整个期间的网页设计是相同的,因此数据格式也相同。


这有帮助吗?

