Tecnología

Inicio

Cómo leer un archivo DOC en Java

Cómo leer un archivo DOC en Java


El lenguaje de programación Java se utiliza para aplicaciones de escritorio o página web. Cuando se realiza la interfaz con los documentos de un usuario en el lenguaje de programación Java, importar bibliotecas necesarias en el archivo de código y de importar el texto del documento. A continuación, puede editar o mostrar la información en la aplicación Java personalizado. Esto es beneficioso para los programadores que necesitan para importar documentos de Word para la manipulación de datos.

Instrucciones

1 Abra el archivo de código Java en su consola. En la parte superior del archivo, escriba el siguiente código para importar las bibliotecas de Word:

importar org.apache.poi.poifs.filesystem. *;

importar org.apache.poi.hwpf. *;

importar org.apache.poi.hwpf.extractor. *;

import java.io. *;

2 Leer el archivo en una variable. Esto le permite implementar funciones sobre el contenido del documento de Word. Escriba el siguiente código en la función de Java que desea controlar la importación de documentos:

fs = new POIFSFileSystem (nuevo FileInputStream ( "c: \ filename.doc");

Reemplazar "c: \ filename.doc" con su propio documento de Word.

3 Asignar los documentos de contenido a una variable. Importar los documentos de Word de contenido para leer cada párrafo. El siguiente código asigna el contenido y los párrafos a una variable asociada:

WordExtractor nos = new WordExtractor (fs);

String [] = párrafos we.getParagraphText ();

4 Imprimir algo del contenido Palabra. Esto es beneficioso cuando se desea verificar que la importación del archivo de Word se ha realizado correctamente. Agregue el código siguiente a su función para imprimir el primer párrafo:

System.out.println ( "El primer párrafo dice:" + párrafos [0] .length);