Extracción de grupo - URLs de páginas secuenciales

circle-check

Cómo usar

1

Verificar las reglas de dirección

Mientras haces clic en los números de página en la página web que deseas extraer, verifica cómo cambia la dirección (URL). En la mayoría de los casos, tiene una estructura donde solo cambia el número después de page=. (La página 1 puede tener el parámetro omitido).

https://www.example.com/categories/420186/?sort=latestarrow-up-right

https://www.example.com/categories/420186?page=2\\&sort=latestarrow-up-right

https://www.example.com/categories/420186?page=3\\&sort=latestarrow-up-right

Usando este principio, puedes crear fácilmente direcciones de paginación para todas las páginas con una sola URL.

2

Usar herramientas de generación automática de URL

A. Usar servicios de IA conversacional Recomendado

Usando servicios de IA conversacional basados en LLM como ChatGPT, puedes generar fácilmente direcciones de páginas secuenciales. Como en la página de ejemplo a continuación, verifica el patrón de dirección de la página que deseas extraer y dile "Crea direcciones URL poniendo el número de página del 1 al 30".

circle-info

Enlace a la página de prueba de Listly: https://test.listly.io/pagination/basic?page=2arrow-up-right

B. Usar constructor de URL

Si buscas "sequential url generator" o "url builder" en portales como Google, puedes encontrar varias herramientas web gratuitas. En esta guía, usaremos como ejemplo el servicio Online Sequential Number, URL & Text Generator. (Si entiendes la estructura de URL, también puedes crearlas fácilmente con fórmulas de Excel).

Al ir al enlace del servicio, aparecerá la siguiente pantalla.

Configura las opciones como en el ejemplo a continuación para generar URLs de páginas secuenciales.

URL de ejemplo: https://www.example.com/categories/420186?page=2\\&sort=latestarrow-up-right

Ingresa la parte antes del número de página que no cambia.

Ingresa el número de página inicial. (La página 1 puede tener el parámetro omitido, pero no hay problema si ingresas page=1).

Ingresa el último número de página.

Ingresa el paso de incremento del número. Normalmente incrementa secuencialmente 1,2,3…, así que ingresa 1.

Ingresa la parte después del número de página que no cambia. Si no hay nada, puedes dejarlo vacío. Después de completar la entrada, haz clic en el botón [Generate] en la parte inferior y las URLs secuenciales se generarán automáticamente.

3

Usar los resultados

Una vez que las URLs se generen secuencialmente según el rango que ingresaste, copia las direcciones generadas y pégalas en la extracción grupal. Puedes extraer múltiples páginas a la vez.

Última actualización

¿Te fue útil?