# テーブルデータ

## 表データ機能とは？

「表のようなデータ」を抽出する際に便利に使用できる機能です。

{% columns %}
{% column %}

<figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/85A58fW5FoxY85H3V8p6/TableData.gif" alt=""><figcaption></figcaption></figure>
{% endcolumn %}

{% column %}

{% endcolumn %}
{% endcolumns %}

{% hint style="info" %}
**超簡単ガイド**

➡️ TABLE DATAをオフにした状態で抽出 ➡️ 「表のようだけど」データが正しく抽出されない場合、TABLE DATAトグルボタンをオンにして再抽出
{% endhint %}

***

左がOFF（オフ）、右がON（オン）の状態です。デフォルトのOFF（オフ）状態で使用し、<mark style="background-color:$success;">**「表のようだけどデータがうまく抽出されていないようだ」**</mark>**と思われる場合**は、\*\*ON（オン）\*\*状態でデータを抽出してみてください。

次のサイトのように、<mark style="background-color:$success;">ウェブページが表（テーブル）のようなデータを抽出する際</mark>に便利に使用できます。

<figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/wjDRa451a9H463XfTJtT/Untitled.png" alt=""><figcaption></figcaption></figure>

<https://www.kpc.or.kr/education/CourseYear.asp?UMEduType=49049012\\&UMEduTheme=49050037>

以下の使用方法セクションで、オプションをオフにした場合とオンにした場合の抽出の違いを確認してください。

***

## 使い方

{% stepper %}
{% step %}

### TABLE DATA - OFF（オフ）

データを抽出すると、<mark style="color:red;">**赤い下線**</mark>でマークされた領域にTABLE-LIKEが適用されたかどうかが表示されます。

<figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/vLs4j6MDnb8YvcvNhDLu/Untitled%201.png" alt=""><figcaption></figcaption></figure>

このオプションがオフになっている場合（OFF）、Excelファイルをダウンロードすると次のようになります。

<figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/UQfz2R2lSRC7qSdsSsye/Untitled%202.png" alt=""><figcaption></figcaption></figure>

**元のページ vs. 抽出されたデータの比較**

元のページと抽出されたデータの一部を比較してみましょう。

でも値が少しおかしいですね。一部の文字列は部分的に重複して抽出されたり（31、31天安、21、21清州など）、列間の空白セルの数も異なります。元のページの薄い緑色でマークされた空白セル領域を基準にExcelファイルと比較すると、**抽出されたデータの配置が元と異なることが一目でわかります。**

<div><figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/2kGUFsYEzyVRHisyicQT/origin_data_empty_cells.png" alt=""><figcaption></figcaption></figure> <figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/5uqIFYM61c5d95OPJixw/Untitled%203.png" alt=""><figcaption></figcaption></figure></div>

{% hint style="success" %}
このような場合は、**IS TABLE-LIKEを**<mark style="color:red;">**`ON`**</mark>**にして再度抽出**してください。
{% endhint %}
{% endstep %}

{% step %}

### TABLE DATA - ON（オン）

同じウェブサイトでTABLE-LIKEオプションをオンにして抽出してみます。

<mark style="color:red;">**赤い下線**</mark>でマークされた領域にTABLE-LIKEが適用されたと表示されます。

<figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/xu9OnyRjn37w9Zk2Gqhf/Untitled%204.png" alt=""><figcaption></figcaption></figure>

**元のページ vs. 抽出されたデータの比較**

1番で比較したのと同じ領域の元のページと抽出されたデータを比較してみます。

TABLE-LIKEオプションを有効にした状態でデータ抽出すると、元のページの<mark style="background-color:green;">薄い緑色</mark>でマークされた空白セル領域と抽出されたデータの**空白セル領域が正確に一致し、重複して抽出されたテキストもありません。**

<div><figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/2kGUFsYEzyVRHisyicQT/origin_data_empty_cells.png" alt=""><figcaption></figcaption></figure> <figure><img src="https://content.gitbook.com/content/I8js41AfLS5QdXKB7e8A/blobs/rOFMwmBJN6Etp7BE2kRH/Untitled%205.png" alt=""><figcaption></figcaption></figure></div>

{% hint style="info" %}
Listlyユーザーを観察した結果、表形式のデータを扱う割合は約10%程度でした。つまり、ほとんどの場合、TABLE-LIKEオプションを使用する必要はありません。そのため、デフォルトのOFF（オフ）状態で使用し、「表のようだけどうまく表示されないようだ」と判断される場合にON（オン）にして抽出することをお勧めします。
{% endhint %}
{% endstep %}
{% endstepper %}
