Tecnología

Inicio

Cómo leer archivos HTML Uso de Java

La lectura de los archivos HTML en Java no es diferente de la lectura de archivos de texto. A menos que el formato del archivo es XML, la lectura de un archivo HTML se logra con un objeto de archivo Java. El objeto se importa el texto del archivo y lo lee línea a línea. A continuación, puede utilizar el texto para la manipulación, o usted puede hacer salir el texto de la pantalla. Utilizando el objeto de archivo en Java para leer archivos se realiza con unas pocas líneas de código.

Instrucciones

1 Importe las bibliotecas necesarias. Utilizando el objeto de archivo requiere el uso de bibliotecas de Java que no se importan automáticamente cuando se crea una nueva clase o proyecto. El código siguiente muestra las bibliotecas necesarias:
importación java.io.BufferedInputStream
IR
importación java.io.DataInputStream
IR
importación java.io.File
IR
importación java.io.FileInputStream
IR
importación java.io.FileNotFoundException
IR
java.io.IOException importación;

2 Abra el archivo y establecer topes. El objeto de archivo necesita la ubicación del archivo HTML en el equipo. Esto también puede ser un archivo en el servidor web. El siguiente código define una variable para abrir el archivo, y crea las variables a utilizar para la filestream.
myhtml archivo = new File (\ "C: \\ myHTML.html \")
IR
FileInputStream fileinput = null
IR
BufferedInputStream mybuffer = null
IR
DataInputStream DataInput = null;

3 Asignar la información del archivo de las variables creadas. Las variables de amortiguamiento cargar la información en la memoria para tiempos de lectura más rápidos.
fileinput = new FileInputStream (myhtml)
IR
mybuffer = new BufferedInputStream (fileinput)
IR
DataInput = new DataInputStream (mybuffer);

4 Crear un bucle que lee el archivo línea por línea y lo imprime en la consola. El siguiente código lee los datos de la medida en que no ha llegado al final de la secuencia de archivo:
mientras que (datainput.available ()! = 0) {

System.out.println(datainput.readLine())

IR

}

5 Cierre la secuencia de archivo. Para liberar memoria de la aplicación, es importante cerrar los flujos de archivos y datos:
myHTML.close ()
IR
mybuffer.close ()
IR
datainput.close ();