Extracción automática de subpáginas
¿Qué es la Recopilación Automática de Subpáginas?

Cuando se publican nuevas publicaciones o productos en una página de lista, la URL de esa subpágina se agrega automáticamente al grupo y procede la extracción. Al usar la función de recopilación automática de subpáginas, puede detectar automáticamente las listas modificadas y recopilar nuevos datos sin necesidad de recopilar o actualizar direcciones una por una.
Esta función es especialmente útil al extraer páginas que se actualizan continuamente como páginas de publicaciones o productos. Por ejemplo, si conecta una página de lista de tienda en línea donde se registran nuevos productos diariamente, la página de detalle del nuevo producto se recopila automáticamente, manteniendo el estado de datos más reciente.
¿Qué es una subpágina (Subpage)?
Se refiere a todas las páginas subordinadas excepto la página principal (página de inicio) del sitio web.
Método de Uso
Crear tarea superior (tarea padre)
Ejecute Listly en la página de lista y haga clic en el botón [Parcial+].

Después de seleccionar el área de extracción, seleccione 'Hyperlink' en las opciones de extracción para recopilar solo los enlaces de cada página de detalle.

Esta tarea que recopiló solo los hipervínculos de la página de detalle es la tarea superior necesaria para 'Recopilación automática de subpáginas'. La URL de esta tarea se utilizará más tarde al conectar con la tarea inferior, por lo que es conveniente copiarla con anticipación.

Crear tarea inferior (tarea hijo) y conectar con tarea superior
Extraiga datos seleccionando el área que servirá como base para la extracción de grupo en la página de detalle. (Este proceso es igual que la Extracción de grupo normal).

Verifique la pestaña donde se ubican los datos seleccionados en la página de resultados, luego haga clic en el botón [+Grupo].

En el campo de entrada de URL en la parte inferior de la ventana de configuración de extracción de grupo, seleccione [Choose URL from existing task] y pegue la URL de la tarea superior creada anteriormente.

Haga clic en el botón [Preview] y seleccione la columna que contiene las URLs de la página de detalle. Es normal que se muestren 5 URLs en la ventana de vista previa inferior. Después de verificar, haga clic en el botón [Completar].


Si registra un grupo de esta manera, la tarea inferior (tarea de extracción de grupo de página de detalle) se conecta debajo de la tarea superior (tarea de recopilación de hipervínculos). Cada vez que la tarea superior descubra un nuevo enlace, esa URL se agregará automáticamente a la tarea inferior y procederá la recopilación. Por lo tanto, configure el programa en la tarea superior.

Configure el programa según el ciclo y la zona horaria deseados.

Cuando la tarea superior se ejecute según el programa configurado, si hay un nuevo elemento registrado en la página de lista, esa URL se actualizará automáticamente en el grupo inferior.


Precauciones
La función de extracción automática de subpáginas no es una función que detecta nuevas publicaciones, sino que opera basándose en un método de extracción automática que se ejecuta según el programa. Cuando la tarea superior se ejecuta según el programa registrado por el usuario, si se descubre nuevo contenido en la página de lista, ese enlace se agrega automáticamente a la tarea inferior y procede la recopilación.
Última actualización
¿Te fue útil?