Tecnología

Inicio

Cómo analizar piezas de HTML con VB

El lenguaje VB.NET incluye una clase de análisis de HTML que se utiliza para extraer los valores HTML de las páginas Web. Utilizar los datos analizados para evaluar el contenido en un sitio y devolver la información a un usuario o almacenar la información extraída de una base de datos. La clase de análisis de HTML le permite leer el contenido del texto o los valores en los elementos de formulario como cuadros de texto o cuadros desplegables.

Instrucciones

1 Abra el software de Visual Studio en el grupo de programas "Microsoft .NET Framework". Abra el proyecto VB después se carga Visual Studio.

2 Haga clic en el nombre del proyecto en el panel "Explorador de soluciones" y seleccionar "Propiedades". Haga clic en la pestaña ".NET", a continuación, haga doble clic en el archivo DLL denominada "Microsoft.mshtml." Esta DLL incluye las clases para analizar HTML.

3 Añadir la biblioteca para el archivo de código VB que desea utilizar para analizar el código HTML. Copia y pega el siguiente declaración VB a la parte superior de su archivo de código:

Las importaciones mshtml

4 Instancia de la clase "HTMLDocument". Esta clase importa el texto HTML que ha importado desde una página Web o una cadena y configura la información para el análisis. Agregue el código siguiente a su función de análisis:

Dim ParseHTML Como IHTMLDocument2 = Nueva HTMLDocumentClass ()
Dim HTMLData Como IHTMLElementCollection = parseHTML.body.all

5 Recuperar el contenido de la cadena HTML. Por ejemplo, el código siguiente recupera el valor de un cuadro de texto HTML en una página Web:

Dim tbData Como IHTMLInputElement = allElements.item ( "TextBox1")
MsgBox "Se trata de los datos en el cuadro de texto:" Y tbData.Value