Extraer HTML de una URL

Botize Scraper

Acción

Extrae el código HTML de una URL específica.


Información entregada

Al ejecutarse, esta operación entrega los siguientes datos, pudiendo ser utilizados en la misma tarea automática.

  • Etiquetas

  • URL {{url}}

    URL

  • Código de estado {{status_code}}

    Código de estado

Video tutoriales


Como conectar Botize Scraper

Pasos para conectar el Scraper gratuito de Botize para navegadores Chrome.

▶ YouTube

Scraping de listados de productos con ChatGPT

Extrae los productos de casi cualquier web que necesites y vuélcalos en una hoja de Google Sheets de manera 100% automática.

▶ YouTube

Scraper de todas las páginas de categorías con ChatGPT

Este vídeo te enseña a extraer todos los productos de cada una de las páginas de casi cualquier web que necesites y volcarlos directa y automáticamente en WooCommerce.

▶ YouTube


Preguntas frecuentes


¿Cómo obtengo el access token que pide la extensión de Chrome?

Cada usuario de Botize tiene un access token distinto. Para obtener el tuyo pulsa el botón 'mostrar access token' que encontrarás dentro de la tarea automática, en el paso en el que tienes seleccionada la aplicación de Botize Scraper.

Mi scraper está parado y la extensión de Chrome muestra el mensaje '✓ Ready for scraping'

Hay dos posibles razones por las que tu scraper podría estar parado.

  1. No hay trabajos de scraping pendientes: Verifica que tienes tareas automáticas activas y que están enviando trabajos de scraping a la extensión.
  2. Access token incorrecto: Si el access token que has introducido en la extensión no es correcto, la extensión no podrá realizar ningún trabajo. Prueba a extraer de nuevo el access token correct y vuelve a introducirlo en la extensión.

¿Existe alguna limitación?

El scraper de Botize es gratuito y puedes procesar tantos trabajos de scraping como necesites. Sin embargo, tu scraper solo puede procesar un trabajo a la vez. Si tus tareas generan trabajos a una velocidad mayor a la que tu scraper los procesa, se acumularán. Los trabajos pueden acumularse durante un máximo de 24 horas. Cualquier trabajo de scraping que permanezca pendiente por más de 24 horas expirará y será automáticamente eliminado.

Errores frecuentes


HTML File is empty

El scraper no está encontrando contenido HTML en la URL proporcionada.

Es posible que la web indicada en la URL requiera más tiempo del previsto en cargar.

Si es así considera aumentar el tiempo de espera modificando el parámetro 'Retraso en la extracción del HTML' de tu tarea automática.

Un tiempo de 5 a 10 segundos suele ser suficiente para la mayoría de webs.

Escríbenos

Por email o por Telegram.
De lunes a viernes de 7h a 13h (España).

Hablemos

Elige día y hora.
Compartimos pantalla y resolvemos todas tus dudas.