Tecnología

Inicio

Cómo reemplazar expresiones regulares en Python

El lenguaje de programación Python utiliza expresiones regulares para la coincidencia de patrones. Los programadores suelen utilizar expresiones regulares para buscar texto para los patrones de letras, símbolos y números. El poder de las expresiones regulares proviene del hecho de que no se utilizan para buscar algo específico, como la palabra "perro"; en cambio, que la búsqueda de palabras que coinciden con un patrón determinado, tales como nombres de dominio de correo electrónico. Por ejemplo, puede utilizar Python para reemplazar los nombres de dominio de una lista de direcciones de correo electrónico utilizando expresiones regulares.

Instrucciones

1 Abra el editor de texto IDLE que viene incluido con el lenguaje Python haciendo clic en su icono. El icono del editor de texto IDLE se encuentra en el directorio de Python en la lista de programas instalados (que se encuentra en Todos los programas en el menú Inicio de Windows, y dentro de la carpeta Aplicaciones en OSX). Un archivo de código fuente en blanco se abre en la ventana principal del editor.

2 Incluir el módulo 're' escribiendo esta línea en la parte superior del archivo de código fuente:

import re

3 Declarar una cadena y asignar algunas direcciones de correo electrónico a la misma, como esto:

emailAddresses = '[email protected], [email protected], [email protected]'

4 Crear una expresión regular que busca todas las posibles permutaciones de texto en direcciones de correo electrónico válidas. Las expresiones regulares funcionan mediante la búsqueda de un patrón de caracteres de una cadena de texto. El patrón le interesa es dos palabras unidas por un símbolo @. Dado que las direcciones de correo electrónico tienen muchos caracteres válidos, que desea hacer coincidir todos los caracteres posibles en cada palabra antes y después del símbolo @. Esto se logra con la expresión regular [\ W.-], y mediante la adición de un + al final de la misma, se puede repetir esta operación para todos los personajes. La expresión regular completado se puede guardar en una cadena como esta:

regexPattern = r '([\ w .-] +) @ ([\ w .-] +) "

5 Crear una expresión regular que sustituye a todos los nombres de dominio con "zmail.com." En esta expresión regular, la secuencia de caracteres retro-referencia \ 1 se utiliza para reemplazar el dominio de las direcciones de correo electrónico. La referencia inversa se refiere a una ubicación en una expresión regular rodeada entre paréntesis. Mediante la aplicación de la expresión regular a la primera referencia hacia atrás, se guarda la dirección de correo electrónico, pero descarta el nombre de dominio de edad. A continuación, puede añadir un nuevo nombre de dominio, como "@ zmail.com. ' Para guardar esta segunda expresión regular para una variable, puede escribir lo siguiente:

regexReplacement = r '\ [email protected]'

6 Aplicar las expresiones regulares a la cadena que contiene las direcciones de correo electrónico como este:

emailAddresses = re.sub (regexPattern, regexReplacement, emailAddresses)

7 Imprimir las direcciones de correo electrónico que utilizan esta línea de código. Python 3 utiliza esta sintaxis para la impresión: impresión (emailAddresses), mientras que Python 2 utiliza esta sintaxis: emailAddresses de impresión.

8 Ejecutar el programa presionando la tecla F5. La salida del programa es:

[email protected], [email protected], [email protected]