
Extraer datos mediante expresiones regulares
Genera nuevas etiquetas con los datos extraidos de una o más expresiones regulares.
Analizador de texto Acción
Automatizar tareas con el Analizador de Texto de Botize te permite extraer datos específicos de textos utilizando expresiones regulares. Esta integración facilita la creación de etiquetas que contienen listas de elementos extraídos según los patrones definidos, optimizando procesos como la extracción de correos electrónicos, números o URLs de cualquier contenido textual.
Con esta herramienta, puedes configurar automatizaciones que procesen textos de manera eficiente, aplicando múltiples expresiones regulares para obtener la información relevante que necesitas. Esto es especialmente útil para tareas como la limpieza de URLs de afiliados en mensajes de Telegram o la extracción de contenido específico de correos electrónicos entrantes.
Cada nueva etiqueta es una lista de 1 o más elementos de acuerdo la expresión regular usada. Para acceder a los valores de cada etiqueta utliza el nombre seguido de un punto y el índice del elemento. Por ejemplo {{nueva_etiqueta.1}} para acceder al segundo valor que contiene la etiqueta.
Esta operación es equivalente al comando match en Javascript.
Opciones de personalización
Campos configurables que puedes ajustar en tu automatización
- Etiquetas
- Tests
Ejemplos de expresiones regulares
La siguiente tabla contiene una lista con ejemplos de expresiones regulares para distintos casos.
Extraer la primera frase
Texto | Text 1. Text 2. Text 3. |
Patrón | /(.[^\.]*)\./ |
Resultados | {{match.0}} → Text 1. {{match.1}} → Text 1 |
Extraer la primera frase y el texto restante por separado
Texto | Text 1. Text 2. Text 3. |
Patrón | /(.[^\.]*)\.(.*)/ |
Resultados | {{match.0}} → Text 1. Text 2. Text 3. {{match.1}} → Text 1 {{match.2}} → Text 2. Text 3. |
Extraer el mail
Texto | My email address is contact@gmail.com |
Patrón | /([a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+)/gi |
Resultados | {{match.0}} → contact@gmail.com |
Extraer el primer número
Texto | The ABC 123 Song |
Patrón | /^[^\d]*(\d+)/ |
Resultados | {{match.0}} → The ABC 123 {{match.1}} → 123 |
Extraer la primera palabra acabada en '-ción'
Texto | La automatización es clave para la optimización |
Patrón | /\b\w*ción\b/ |
Resultados | {{match.0}} → automatización |
Extraer todo el texto hasta encontrar la cadena '</a>'
Texto | Pulsa en el enlace <a href="#">Link</a> y sigue las instrucciones. |
Patrón | /(.*?<\/a>)/ |
Resultados | {{match.0}} → Pulsa en el enlace <a href="#">Link</a> {{match.1}} → y sigue las instrucciones. |
Extraer la primera URL
Texto | Visit my website https://abc.com/section?param=1 |
Patrón | /(http|ftp|https)://([\w_-]+(?:(?:\.[\w_-]+)+))([\w.,@?^=%&:/~+#-]*[\w@?^=%&/~+#-])/ |
Resultados | {{match.0}} → https://abc.com/section?param=1 {{match.1}} → https {{match.2}} → abc.com {{match.3}} → /section?param=1 |
Extraer la primera URL de un dominio determinado
Texto | Visit my website https://abc.com/section?param=1 and https://xyz.com |
Patrón | /https://ad\.admitad\.com/[^"\s]+/ |
Resultados | {{match.0}} → https://xyz.com |
Información entregada
Al ejecutarse, esta operación entrega los siguientes datos, pudiendo ser utilizados en la misma tarea automática.
Etiquetas
- _status {{_status}}
Hablemos
Elige día y hora.
Compartimos pantalla y resolvemos todas tus dudas.