# 表格数据

## 什么是表格数据？

这是一个在提取"看起来像表格"的数据时非常有用的功能。

{% columns %}
{% column width="58.333333333333336%" %}

<figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/F0NuaFjjh9bHJb4CwuLe/TableData.gif" alt=""><figcaption></figcaption></figure>
{% endcolumn %}

{% column width="41.666666666666664%" %}

{% endcolumn %}
{% endcolumns %}

{% hint style="info" %}
**快速入门**

➡️ 在 TABLE DATA 关闭时提取 ➡️ 如果"看起来像表格"但数据提取不正确，打开 TABLE DATA 切换开关重新提取
{% endhint %}

***

左边是关闭状态，右边是开启状态。使用默认的关闭状态，**当您觉得"看起来像表格但数据提取不好"时**，尝试**开启**后再提取。

对于像这个网站一样看起来像表格（tables）的网页数据提取很有用：

<figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/KAiYJYQNdsRzZICppJyF/Untitled.png" alt=""><figcaption></figcaption></figure>

<https://www.kpc.or.kr/education/CourseYear.asp?UMEduType=49049012\\&UMEduTheme=49050037>

在下方的使用方法部分查看选项关闭和开启时的提取差异。

***

## 使用方法

{% stepper %}
{% step %}

### TABLE DATA - 关闭

提取数据时，<mark style="color:red;">**红色下划线**</mark>区域显示 TABLE-LIKE 是否已应用。

<figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/sydO7j52Vb1NcPSk8n6K/Untitled%201.png" alt=""><figcaption></figcaption></figure>

当此选项关闭（OFF）时，下载 Excel 文件看起来像这样：

<figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/vph5he5arkNEpjpgQejz/Untitled%202.png" alt=""><figcaption></figcaption></figure>

**原始页面与提取数据对比**

让我们将原始页面与部分提取数据进行对比。

但这些值看起来有点不对。一些字符串在提取时被部分重复（31, 31Cheonan, 21, 21Cheongju 等），列之间的空白数量也不同。将原始页面的浅绿色空白区域与 Excel 文件对比，可以看到**提取数据的对齐方式与原始页面一眼就能看出不同**。

<div><figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/D2j2CvWJd2Llw1SfPkUP/origin_data_empty_cells.png" alt=""><figcaption></figcaption></figure> <figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/6Aw1JxHwoYIorAUiYnFK/Untitled%203.png" alt=""><figcaption></figcaption></figure></div>

{% hint style="success" %}
**在这种情况下，将 IS TABLE-LIKE 切换到** <mark style="color:red;">**`ON`**</mark> **并重新提取**。
{% endhint %}
{% endstep %}

{% step %}

### TABLE DATA - 开启

让我们在开启 TABLE-LIKE 选项的情况下从同一网站提取。

<mark style="color:red;">**红色下划线**</mark>区域显示 TABLE-LIKE 已应用。

<figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/5pdvJ6rRXMx66YNg3Ian/Untitled%204.png" alt=""><figcaption></figcaption></figure>

**原始页面与提取数据对比**

让我们将原始页面与第 1 节相同区域的提取数据进行对比。

启用 TABLE-LIKE 选项提取数据时，原始页面上用<mark style="background-color:green;">浅绿色</mark>标记的空白区域**与提取数据的空白区域完全匹配，且没有重复的文本**。

<div><figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/D2j2CvWJd2Llw1SfPkUP/origin_data_empty_cells.png" alt=""><figcaption></figcaption></figure> <figure><img src="https://content.gitbook.com/content/LlkvcuviCyyU871Augk5/blobs/qsecqJ0gH0cg5ZROftOU/Untitled%205.png" alt=""><figcaption></figcaption></figure></div>

{% hint style="info" %}
观察 Listly 用户，只有约 10% 的用户处理表格数据。所以在大多数情况下，您不需要 TABLE-LIKE 选项。使用默认的关闭状态，只有当您判断"看起来像表格但提取不好"时才将其开启。
{% endhint %}
{% endstep %}
{% endstepper %}
