设置 - 日志批量提取 - 空白单元格

快速入门

➡️ 在 DATABOARD 中选择结果日志 ➡️ 以最新数据作为源进行提取 ➡️ 如果出现空白单元格 选择最早的数据作为源进行提取


使用方法

https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=코로나https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=%EC%BD%94%EB%A1%9C%EB%82%98

Screenshot

我已经从这个页面采集数据大约 7 个月了。

  • 采集期间:2020年8月19日 ~ 2021年3月8日

  • 每天下午4点自动采集

  • 共 204 条日志记录(从开始到现在 7 个月后全部成功提取)

网页设计在 2020年11月1日 突然发生了变化。请记住这个日期,因为它成为下面提取日志数据的参考点。

截至 2021年3月8日,我想把所有过去的数据汇总在一起。我将把所有内容整理到一个 Excel 表格中。这与批量提取的工作方式相同。Excel 输出会根据您选择哪个数据作为源而有所不同。

从 204 条记录中选择要作为源使用的数据结果 → 下载日志 Excel

日志选择 1
日志选择 2
日志列表截图
1

选择最新(第 204 条)数据作为源

我将使用最近采集的第 204 条数据作为源进行提取。第 204 条数据出现在 Excel 的顶部,其余按采集时间升序出现。第 204 条数据在顶部意味着我将其用作参考来查找和整理具有相同模式的数据。

第一张图片清楚地显示了许多空白单元格。有空白单元格的日期和有数据的日期如下:

  • 有空白单元格的采集日期范围:2020年8月19日 ~ 2020年10月31日

  • 有数据的采集日期范围:2020年11月1日 ~ 2021年3月7日

为什么?因为作为日志批量提取源,选择了 2021年3月8日 的数据结果。此数据与 2020年11月1日 ~ 2021年3月7日 采集的所有数据格式相同——整个期间的网页设计是相同的,因此数据格式也相同。

使用最新数据作为源的结果 1
使用最新数据作为源的结果 2
2

选择最早(第 1 条)数据作为源

要获取显示为空白单元格的数据(2020年8月19日 ~ 2020年10月31日),请选择该期间的数据结果作为源并下载日志 Excel。在此示例中,使用第 1 条数据(2020年8月19日 采集)作为源会产生相反的结果:

  • 有数据的采集日期范围:2020年8月19日 ~ 2020年10月31日

  • 有空白单元格的采集日期范围:2020年11月1日 ~ 2021年3月7日

使用最早数据作为源的结果 1
使用最早数据作为源的结果 2

这有帮助吗?