Datos de tabla

¿Qué es la Función de Datos de Tabla?

Es una función que se puede utilizar útilmente al extraer 'datos que parecen una tabla'.

circle-info

Guía Rápida

➡️ Extraer con TABLE DATA desactivado ➡️ Si 'parece una tabla' pero los datos no se extraen correctamente, reextraer con el botón de alternancia TABLE DATA activado


La izquierda es el estado OFF (desactivado), la derecha es el estado ON (activado). Use el valor predeterminado OFF (desactivado), y si piensa 'parece una tabla pero los datos no parecen extraerse bien', intente extraer datos en el estado ON (activado).

Se puede utilizar útilmente al extraer datos que parecen una tabla en la página web como el siguiente sitio.

https://www.kpc.or.kr/education/CourseYear.asp?UMEduType=49049012&UMEduTheme=49050037arrow-up-right

Verifique la diferencia de extracción cuando la opción está desactivada y activada en la sección de método de uso a continuación.


Método de Uso

1

TABLE DATA - OFF (desactivado)

Al extraer datos, el área marcada con línea roja indica si se aplicó TABLE-LIKE.

Si esa opción está desactivada (OFF), al descargar el archivo de Excel es como se muestra a continuación.

Comparación de página original vs. datos extraídos

¿Comparamos parte de la página original y los datos extraídos?

Pero los valores son un poco extraños. Algunas cadenas de texto se extrajeron parcialmente duplicadas (31, 31Cheonan, 21, 21Cheongju, etc.) y el número de espacios vacíos entre columnas también es diferente. Si compara con el archivo de Excel basándose en las áreas de espacios vacíos marcadas en verde claro de la página original, puede ver de un vistazo que la alineación de los datos extraídos es diferente de la original.

circle-check
2

TABLE DATA - ON (activado)

Extraigamos desde el mismo sitio web con la opción TABLE-LIKE activada.

El área marcada con línea roja muestra que se aplicó TABLE-LIKE.

Comparación de página original vs. datos extraídos

Comparemos la página original y los datos extraídos de la misma área comparada en el paso anterior.

Al extraer datos con la opción TABLE-LIKE activada, las áreas de espacios vacíos de los datos extraídos coinciden exactamente con las áreas de espacios vacíos marcadas en verde claro de la página original, y no hay texto extraído duplicado.

circle-info

Como resultado de observar a los usuarios de Listly, la proporción de manejo de datos en forma de tabla era de aproximadamente el 10%. Es decir, en la mayoría de los casos no necesitará usar la opción TABLE-LIKE. Así que recomendamos usar el valor predeterminado OFF (desactivado) y, si juzga que 'parece una tabla pero no parece salir bien', active ON (activado) e intente extraer.

Última actualización

¿Te fue útil?