ログ グループ抽出 - 空白セル
ログ グループ抽出とは?
複数回の抽出(毎時、毎日)から収集された情報を一度にダウンロードする機能です。同じページを2回以上抽出するとログが作成されます。この機能を使用して、過去のデータを1つのExcelシートにまとめます。
ログ グループ抽出中に空白セルが表示される場合は、ソースを変更して再度抽出してみてください。
使い方
<ログ グループ抽出の例>
https://search.naver.com/search.naver?where=realtime&sm=tab_jum&query=%EC%BD%94%EB%A1%9C%EB%82%98

このページから約7ヶ月間データを収集してきました。
収集期間:2020年8月19日〜2021年3月8日
毎日午後4時に自動収集
合計204件のログエントリ(開始から現在まで7ヶ月間、すべて正常に抽出)
2020年11月1日にウェブページのデザインが突然変更されました。この日付は、以下のログデータ抽出の基準点となるため、覚えておいてください。
2021年3月8日現在、すべての過去データをまとめたいと思います。すべてを1つのExcelシートに整理します。これはグループ抽出と同じように機能します。Excelの出力は、ソースとして選択するデータによって異なります。
204件のエントリからソースとして使用するデータ結果を選択 → ログExcelをダウンロード



最新(204番目)のデータをソースとして選択
最新に収集された204番目のデータをソースとして使用して抽出します。以下に示すように、204番目のデータがExcelの上部に表示され、残りは収集時間の昇順で表示されます。204番目のデータが上部にあるということは、それを参照として同じパターンのデータを見つけて整理したことを意味します。
最初の画像には多くの空白セルが明確に表示されています。空白セルのある日付とデータのある日付は次のとおりです:
空白セルのある収集日範囲:2020年8月19日〜2020年10月31日
データのある収集日範囲:2020年11月1日〜2021年3月7日
お気づきですか?デザインが変更された2020年11月1日を基準に、それ以前の日付には空白セルが表示され、それ以降の日付にはデータが表示されます。なぜでしょうか?
ログ グループ抽出のソースとして、2021年3月8日のデータ結果を選択しました。このデータは、2020年11月1日〜2021年3月7日に収集されたすべてのデータと同じ形式です。簡単に言えば、この期間中にウェブページのデザインが同一であったため、データ形式も同一でした。


最終更新
役に立ちましたか?

