-
Cómo analizar un archivo HTML con Rubí
-
Ruby es un lenguaje de programación web similar en la filosofía de PHP o Python. Rubí fue desarrollado con el fin de crear fácil de implementar secuencias de comandos con código legible, fácil de implementar y depurar. Rubí también contiene un instalador fácil biblioteca llamada "joya", que le permite instalar módulos para realizar diversas tareas. Por ejemplo, mediante la instalación del módulo "Nokogiri" a través de la gema, puede analizar fácilmente a través de archivos HTML con un par de llamadas a funciones simples.
Instrucciones
1 Descargar Nokogiri, un analizador de HTML para Ruby, usando el instalador joya. Ejecute el comando siguiente en una ventana de comandos:
sudo gem install nokogiri
2 En su código Ruby, requerir el módulo nokogiri con la palabra clave "requerir":
1 / usr / bin / ruby
require 'nokogiri'3 Analiza un documento HTML de ejemplo con un objeto Nokogiri: El objeto contendrá todo el contenido y el HTML del objeto:
require 'nokogiri'
doc = Nokogiri :: HTML (<< - eohtml)
<Html>
<Body>
<H1> ¡Hola mundo </ h1>
</ Div>
</ Body>
</ Html>
eohtml