# Extracción automática de subpáginas

## ¿Qué es la Recopilación Automática de Subpáginas?

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/rgk3tKI6hJ3VUuo4cpwA/enterprise%20subpage%201.png" alt=""><figcaption></figcaption></figure>

Cuando se publican nuevas publicaciones o productos en una página de lista, la URL de esa subpágina se agrega automáticamente al grupo y procede la extracción. Al usar la función de recopilación automática de subpáginas, puede **detectar automáticamente las listas modificadas y recopilar nuevos datos** sin necesidad de recopilar o actualizar direcciones una por una.

Esta función es especialmente útil al extraer **páginas que se actualizan continuamente como páginas de publicaciones o productos**. Por ejemplo, si conecta una página de lista de tienda en línea donde se registran nuevos productos diariamente, la página de detalle del nuevo producto se recopila automáticamente, **manteniendo el estado de datos más reciente**.

{% hint style="success" %}
**¿Qué es una subpágina (Subpage)?**

Se refiere a todas las páginas subordinadas excepto la página principal (página de inicio) del sitio web.
{% endhint %}

***

## Método de Uso

{% stepper %}
{% step %}

### Crear tarea superior (tarea padre)

* Ejecute Listly en la página de lista y haga clic en el botón **\[Parcial+]**.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/0o3GcFiBbPoNEcofyNhs/enterprise%20subpage%202.png" alt=""><figcaption></figcaption></figure>

* Después de seleccionar el área de extracción, seleccione **'Hyperlink'** en las opciones de extracción para recopilar solo los enlaces de cada página de detalle.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/XwXgPKcfYt4YhtXExx1Z/enterprise%20subpage%203.png" alt=""><figcaption></figcaption></figure>

* **Esta tarea que recopiló solo los hipervínculos de la página de detalle es la tarea superior necesaria para 'Recopilación automática de subpáginas'.** La URL de esta tarea se utilizará más tarde al conectar con la tarea inferior, por lo que es conveniente copiarla con anticipación.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/ttvr9Q5pS2U7lLtSS3GN/enterprise%20subpage%204.png" alt=""><figcaption></figcaption></figure>
{% endstep %}

{% step %}

### Crear tarea inferior (tarea hijo) y conectar con tarea superior

1. Extraiga datos seleccionando el área que servirá como base para la extracción de grupo en la página de detalle.\
   (Este proceso es igual que la [Extracción de grupo](https://help.listly.io/docs/ko/getting-started/result-page-features/group-extraction) normal).

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/SzZ2okJazQCq6XGjyulS/enterprise%20subpage%205.png" alt=""><figcaption></figcaption></figure>

2. Verifique la pestaña donde se ubican los datos seleccionados en la página de resultados, luego haga clic en el botón **\[+Grupo]**.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/0nQnfhQixKmb3A7Gqosa/enterprise%20subpage%206.png" alt=""><figcaption></figcaption></figure>

3. En el campo de entrada de URL en la parte inferior de la ventana de configuración de extracción de grupo, seleccione **\[Choose URL from existing task]** y pegue la URL de la tarea superior creada anteriormente.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/dc6pSb2T20b43jLLSvS8/enterprise%20subpage%207.png" alt=""><figcaption></figcaption></figure>

4. Haga clic en el botón **\[Preview]** y seleccione la columna que contiene las URLs de la página de detalle. Es normal que se muestren 5 URLs en la ventana de vista previa inferior. Después de verificar, haga clic en el botón **\[Completar]**.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/4A6Ta3NwNgtoX2GCX64v/enterprise%20subpage%208.png" alt=""><figcaption></figcaption></figure>

![](https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/CIIbcPpdu8GTRSRRxmg9/unknown.png)

5. Si registra un grupo de esta manera, la tarea inferior (tarea de extracción de grupo de página de detalle) se conecta debajo de la tarea superior (tarea de recopilación de hipervínculos). Cada vez que la tarea superior descubra un nuevo enlace, esa URL se agregará automáticamente a la tarea inferior y procederá la recopilación. Por lo tanto, **configure el programa en la tarea superior**.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/YnV0QvEWNMmWe3mVVHev/enterprise%20subpage%209.png" alt=""><figcaption></figcaption></figure>

6. Configure el programa según el ciclo y la zona horaria deseados.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/BEVBpNrqirNnRSpLHntk/enterprise%20subpage%2010.png" alt=""><figcaption></figcaption></figure>

7. Cuando la tarea superior se ejecute según el programa configurado, si hay un nuevo elemento registrado en la página de lista, esa URL se actualizará automáticamente en el grupo inferior.

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/jAuMUWijvte0v4LpVajf/enterprise%20subpage%2011.png" alt=""><figcaption></figcaption></figure>

<figure><img src="https://content.gitbook.com/content/IB9ndOCr7FFgFMzgmMpx/blobs/yrpSXhYVMy5eJofoMRUY/enterprise%20subpage%2012.png" alt=""><figcaption></figcaption></figure>
{% endstep %}
{% endstepper %}

{% hint style="warning" %}
**Precauciones**

La función de extracción automática de subpáginas no es una función que detecta nuevas publicaciones, sino que opera basándose en un **método de extracción automática que se ejecuta según el programa**. Cuando la tarea superior se ejecuta según el programa registrado por el usuario, si se descubre nuevo contenido en la página de lista, ese enlace se agrega automáticamente a la tarea inferior y procede la recopilación.
{% endhint %}
