Tecnología

Inicio

Cómo consultar un cuerpo HTML en LINQ

El HTML agilidad paquete .NET incluye las bibliotecas de LINQ para importar el contenido del cuerpo HTML de una página Web HTML a distancia. LINQ se utiliza normalmente para las conexiones de base de datos, pero las herramientas .NET extendió el uso de LINQ a datos XML y HTML en su sitio web o un sitio web externo a distancia. Este método se utiliza para importar el texto del cuerpo y el código HTML de una página Web.

Instrucciones

1 Abra Visual Studio y el proyecto que desea editar. Haga doble clic en el archivo de código fuente para abrir el código en el espacio de trabajo.

2 Añadir las bibliotecas LINQ al archivo. Copia y pega el código siguiente al principio de la página Web:

utilizando HtmlAgilityPack;

3 Enlace a la página web mediante la URL de la página. El código siguiente abre "site.com", pero se puede utilizar cualquier URL en su lugar:

var = new web HtmlWeb ();
documento var = web.Load ( "site.com");

4 Obtener la información de la etiqueta "cuerpo". El código siguiente recupera la información contenida en la etiqueta "cuerpo" de la página Web:

var = contenido de LNKs en document.DocumentNode.Descendants (), donde lnks.Name == "cuerpo"

Text = lnks.innerHTML