Tecnología

Inicio

Cómo utilizar Apache PDFBox

En caso de publicar artículos, documentos u otra información en su página web, archivos PDF ofrecen una manera conveniente para los visitantes de su sitio para descargar y compartir su contenido. Apache es un PDFBox de código abierto biblioteca libre, Java PDF utilizado para la creación de PDF y la manipulación. la creación de PDF y la extracción de texto se encuentran entre las funciones más básicas del programa. Aprender a usar Apache PDFBox es relativamente sencillo, lo que le permite compilar documentos PDF para su sitio web en un corto período de tiempo.

Instrucciones

Creación de PDF - Página en blanco

1 Crear un documento PDF vacía escribiendo el siguiente código de secuencia en una línea: "documento = new PDDocument ();" (No incluya las comillas al escribir cualquiera de los códigos de transmisión).

2 Añadir una página al documento PDF vacía escribiendo el siguiente comando en una línea independiente: "PDPage BlankPage = new PDPage ();" presionar "Enter" en el teclado y escribir la siguiente línea de código de su propia línea, "document.addPage (BlankPage) ;."

3 Guarde el archivo PDF en blanco y utilizarlo como una plantilla para la creación de archivos PDF en el futuro si escribe la línea siguiente comando en su propia línea: "document.save (" BlankPage.pdf ") ;."

4 Cierre el documento para que sea permanente escribiendo la siguiente línea de comandos: "document.close () ;."

Creación de PDF - Archivo con texto

5 Abra la plantilla del archivo PDF en blanco que acaba de crear y rellenarlo con el texto cambiando y añadiendo unas pocas líneas en el código. En la segunda línea de código, "PDPage BlankPage = new PDPage ();" cambio "BlankPage" a la "página".

6 Pulse la tecla "Enter" en el teclado para ir a la siguiente línea y añadir la siguiente línea de código: "document.addPage (página) ;."

7 Pulse la tecla "Enter" en el teclado y crear una descripción de la fuente utilizando el tipo de letra estándar PDF escribiendo la siguiente línea de código: "font = PDFont PDType1Font.HELVETICA_BOLD ;."

8 Pulse la tecla "Enter" en el teclado y crear un flujo de contenido escribiendo en la siguiente línea de comandos: "PDPageContentStream contentStream = new PDPageContentStream (documento, página) ;."

9 Pulse la tecla "Enter" en el teclado y definir el contenido, la fuente y la posición del texto escribiendo las siguientes líneas de comandos: "contentStream.beginText (); contentStream.setFont (fuente, 12); contentStream.moveTextPositionByAmount (100, 700); contentStream.drawString ( "Escriba su texto aquí"); contentStream.endText (); " presionar "Enter" en el teclado después de cada punto y coma.

10 Cierre la línea de tren de contenido escribiendo la siguiente línea de comandos "contentStream.close () ;."

11 Añadir el título de su archivo PDF en la línea de comando Guardar documento, "document.save (" BlankPage.pdf ");" mediante la sustitución de "BlankPage" con su propio nombre de archivo.

12 Mantener la estrecha línea del documento al igual que para mantener el documento sellado.

PDF Text Extractor De archivo PDF existente

13 Abra la caja de PDF y el tipo en la línea de comandos siguiente para transformar un archivo PDF existente en un documento de texto simple: "Documento luceneDocument = LucenePDFDocument.getDocument (nombre del archivo PDF movible aquí) ;."

14 Extraer el texto que necesita desde el archivo PDF a partir del documento de texto simple, poniendo de relieve, haga clic en el botón de "derecha" del ratón y seleccione "Copiar" en el menú. Pega el siguiente texto extraído en un documento haciendo clic en el botón del ratón "derecha" y seleccionando "Pegar" en el menú.

15 Extracto de una línea específica de texto inmediatamente a partir de un archivo PDF existente tecleando las siguientes líneas de comandos: "PDFTextStripper separador = new PDFTextStripper (); stripper.setStartPage (especificar la página de inicio aquí, por ejemplo, 16); stripper.setEndPage (especificar la página final aquí, por ejemplo, 23); stripper.writeText (...); pulse "Enter" en el teclado después de cada punto y coma.

Consejos y advertencias

  • El procedimiento anterior funciona con PDFBox versión 1.8.5. El proceso puede ser la misma o variar ligeramente en las versiones anteriores.