ログ グループ抽出 - 空白セル

クイックステップ

➡️ DATABOARDで結果ログを選択 ➡️ 最新データをソースとして抽出 ➡️ 空白セルが表示される場合 最も古いデータをソースとして選択して抽出


使い方

<ログ グループ抽出の例>

https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=%EC%BD%94%EB%A1%9C%EB%82%98

このページから約7ヶ月間データを収集してきました。

  • 収集期間:2020年8月19日〜2021年3月8日

  • 毎日午後4時に自動収集

  • 合計204件のログエントリ(開始から現在まで7ヶ月間、すべて正常に抽出)

2020年11月1日にウェブページのデザインが突然変更されました。この日付は、以下のログデータ抽出の基準点となるため、覚えておいてください。

2021年3月8日現在、すべての過去データをまとめたいと思います。すべてを1つのExcelシートに整理します。これはグループ抽出と同じように機能します。Excelの出力は、ソースとして選択するデータによって異なります。

204件のエントリからソースとして使用するデータ結果を選択 → ログExcelをダウンロード

1

最新(204番目)のデータをソースとして選択

最新に収集された204番目のデータをソースとして使用して抽出します。以下に示すように、204番目のデータがExcelの上部に表示され、残りは収集時間の昇順で表示されます。204番目のデータが上部にあるということは、それを参照として同じパターンのデータを見つけて整理したことを意味します。

最初の画像には多くの空白セルが明確に表示されています。空白セルのある日付とデータのある日付は次のとおりです:

  • 空白セルのある収集日範囲:2020年8月19日〜2020年10月31日

  • データのある収集日範囲:2020年11月1日〜2021年3月7日

お気づきですか?デザインが変更された2020年11月1日を基準に、それ以前の日付には空白セルが表示され、それ以降の日付にはデータが表示されます。なぜでしょうか?

ログ グループ抽出のソースとして、2021年3月8日のデータ結果を選択しました。このデータは、2020年11月1日〜2021年3月7日に収集されたすべてのデータと同じ形式です。簡単に言えば、この期間中にウェブページのデザインが同一であったため、データ形式も同一でした。

2

最も古い(1番目)のデータをソースとして選択

では、空白セルとして表示されたデータ(2020年8月19日〜2020年10月31日)を取得するにはどうすればよいでしょうか?簡単です。空白セルとして表示されたデータをソースとして選択 → ログExcelをダウンロード。今回は、1番目のデータ(2020年8月19日に収集)を新しいソースとして使用します。今回は逆の結果が表示されます:

  • データのある収集日範囲:2020年8月19日〜2020年10月31日

  • 空白セルのある収集日範囲:2020年11月1日〜2021年3月7日

最終更新

役に立ちましたか?