Tecnología

Inicio

Cómo analizar un archivo HTML con Rubí

Ruby es un lenguaje de programación web similar en la filosofía de PHP o Python. Rubí fue desarrollado con el fin de crear fácil de implementar secuencias de comandos con código legible, fácil de implementar y depurar. Rubí también contiene un instalador fácil biblioteca llamada "joya", que le permite instalar módulos para realizar diversas tareas. Por ejemplo, mediante la instalación del módulo "Nokogiri" a través de la gema, puede analizar fácilmente a través de archivos HTML con un par de llamadas a funciones simples.

Instrucciones

1 Descargar Nokogiri, un analizador de HTML para Ruby, usando el instalador joya. Ejecute el comando siguiente en una ventana de comandos:

sudo gem install nokogiri

2 En su código Ruby, requerir el módulo nokogiri con la palabra clave "requerir":

1 / usr / bin / ruby

require 'nokogiri'

3 Analiza un documento HTML de ejemplo con un objeto Nokogiri: El objeto contendrá todo el contenido y el HTML del objeto:

require 'nokogiri'
doc = Nokogiri :: HTML (<< - eohtml)
<Html>
<Body>
<H1> ¡Hola mundo </ h1>
</ Div>
</ Body>
</ Html>
eohtml