Extraer datos mediante expresiones regulares

Operaciones con textos

Acción

Genera nuevas etiquetas con los datos extraidos de una o más expresiones regulares.
Cada nueva etiqueta es una lista de 1 o más elementos de acuerdo la expresión regular usada. Para acceder a los valores de cada etiqueta utliza el nombre seguido de un punto y el índice del elemento. Por ejemplo {{nueva_etiqueta.1}} para acceder al segundo valor que contiene la etiqueta.
Esta operación es equivalente al comando match en Javascript.


Ejemplos de expresiones regulares

La siguiente tabla contiene una lista con ejemplos de expresiones regulares para distintos casos.

Extraer la primera frase

Texto Text 1. Text 2. Text 3.
Patrón /(.[^\.]*)\./
Resultados {{match.0}} → Text 1.
{{match.1}} → Text 1

Extraer la primera frase y el texto restante

Texto Text 1. Text 2. Text 3.
Patrón /(.[^\.]*)\.(.*)/
Resultados {{match.0}} → Text 1. Text 2. Text 3.
{{match.1}} → Text 1
{{match.2}} → Text 2. Text 3.

Extraer el mail

Texto My email address is contact@gmail.com
Patrón /([a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+)/gi
Resultados {{match.0}} → contact@gmail.com

Extraer el primer número

Texto The ABC 123 Song
Patrón /^[^\d]*(\d+)/
Resultados {{match.0}} → The ABC 123
{{match.1}} → 123

Extraer la primera URL

Texto Visit my website https://abc.com/section?param=1
Patrón /(http|ftp|https)://([\w_-]+(?:(?:\.[\w_-]+)+))([\w.,@?^=%&:/~+#-]*[\w@?^=%&/~+#-])/
Resultados {{match.0}} → https://abc.com/section?param=1
{{match.1}} → https
{{match.2}} → abc.com
{{match.3}} → /section?param=1

Extraer la primera URL de un dominio determinado

Texto Visit my website https://abc.com/section?param=1 and https://xyz.com
Patrón /https://ad\.admitad\.com/[^"\s]+/
Resultados {{match.0}} → https://xyz.com

Video tutoriales


Expresiones Regulares con ChatGPT

Escenarios y ejemplos para obtener expresiones regulares sin esfuerzo gracias a GPT.

▶ YouTube

Canal de Amazon Afiliados para Telegram con Scraping + ChatGPT

Crear contenido automático a partir de fuentes RSS, ayudándonos de ChatGPT para la extracción de los datos.

▶ YouTube


Escríbenos

Por email o por Telegram.
De lunes a viernes de 7h a 13h (España).

Hablemos

Elige día y hora.
Compartimos pantalla y resolvemos todas tus dudas.