Tecnología

Inicio

Cómo mostrar una URL Uso de expresiones regulares

Cómo mostrar una URL Uso de expresiones regulares


Las expresiones regulares proporcionan al programador herramientas poderosas para el análisis y la manipulación de texto. Encuentran en todas partes de la forma de validación de comercio electrónico de alto riesgo de litigios - donde buscar abogados para las combinaciones de palabras en mensajes de correo electrónico que se suman a los "culpables" - expresiones regulares tienen cabida en la caja de herramientas de todo programador. Por desgracia, su sintaxis arcano se erige como una barrera para muchos usuarios que podrían beneficiarse de ellos. Un posible uso está escaneando un texto para Universal Resource Locator, conocidos coloquialmente como direcciones web. El lenguaje de programación Python realiza esta tarea en tan sólo unas pocas líneas de código.

Instrucciones

1 IDLE abierto y crear un archivo de texto de prueba al copiar y pegar un texto al azar en el archivo junto con algunas de las URL. Guarde el archivo como TestText.txt en el directorio que aparece en el cuadro de diálogo guardar por lo que no tiene que preocuparse acerca de las rutas entre el intérprete de Python y este archivo.

2 Ir a la ventana principal y el tipo REPOSO

import re

en el indicador de Python. Esto carga motor de expresiones regulares de Python.

3 Leer el texto de prueba en Python y mantenerlo en la memoria con los siguientes comandos:

TestText = abierto ( 'OCB_1.txt')

prima = TestText.read ()

OCB_1.txt es el nombre de mi archivo de prueba -. Una copia y pega de Ambrose Bierce de "un suceso en el puente de Owl Creek", con algunas URL pegadas al formato En los comandos anteriores, el archivo de texto se abre y se asigna a la variable testText; a continuación, se lee en la memoria con la prima variable asignada.

4 Pre-compilar la expresión regular con el fin de acelerar el proceso de análisis. Esto es especialmente útil cuando se trata de grandes archivos de texto. Escriba los siguientes comandos en el símbolo de Python:

pattobj = re.compile ( "https: // ([- \ w.] +) + (?:? \ d +) (/ ([\ w / _.] * (\ \ S +)))???? ')

5 Invoque el método findall escribiendo el comando de expresiones regulares relevante junto con la variable hace referencia al texto en la memoria:

findallobj = pattobj.findall (en bruto)

Esto crea una nueva variable, findallobj, que contiene los patrones producidos por la expresión regular.

6 Mostrar la URL encontrado la expresión regular con el comando de impresión:

impresión (findallobj)

La salida es como la siguiente:

[( 'Www.sjca.edu'), ( 'www.cantlers.com/index.shtml')]

Consejos y advertencias

  • Guarde estos pasos como una secuencia de comandos Python con el nombre find_url.py. Se puede ejecutar de nuevo, simplemente cambiando el nombre del archivo de texto que desea buscar.
  • La expresión regular que coincide con las direcciones URL, ( "https: // ([- \ w \.] +) + (:???? \ D +) (/ ([. \ W / _ \] * (\ \ S +)) ?)? '), se puede utilizar en Perl, JavaScript, VB.net, y muchas otras herramientas de programación y script con ajustes menores.