Tecnología

Inicio

Cómo convertir un PDF a HTML con Ubuntu

Cómo convertir un PDF a HTML con Ubuntu


Hay varias maneras de intentar cambiar un archivo PDF en un archivo HTML. Tenga en cuenta, el producto final será probablemente no parecer tan bueno como el original. El formato de documento portátil no es fácil de eludir. HTML no funciona con el texto y las imágenes de la misma manera que los archivos PDF hacen, especialmente aquellas más complejas, pero aquí hay algunas maneras de intentarlo.

Instrucciones

3 Métodos

1 La forma más fácil es ir al sitio Web de Adobe y cargar sus archivos PDF. Probablemente debido a la erupción del software que está siendo comercializado hacer esto mismo, Adobe ofrece de forma gratuita. Todo lo que tiene que hacer es llenar algunos espacios en blanco, haga clic en un botón y listo.

http://www.adobe.com/products/acrobat/access_onlinetools.html

2 Otra forma es utilizar una pequeña herramienta llamada ImageMagick. Es fácil de encontrar en Synaptic. Descargarlo, selecciónelo de la "abrir con" del menú, y "guardar como" html. La única colgar con él es que sólo se puede hacer una página a la vez.

3 La última forma es utilizar un pequeño programa llamado pdftohtml. Para ello hay que utilizar el terminal para asegurarse de que poppler-utils está instalado.

sudo aptitude install poppler-utils

El programa se instalará automáticamente, y entonces usted tiene que navegar hasta el directorio en el que se encuentra el archivo PDF. Una vez allí, todo lo que tiene que hacer es escribir:

pdftohtml -c [nombre de archivo] .pdf [nombre de archivo] .html

El producto final no es muy diferente de la que propuesta por el sitio Web de Adobe, pero podrá ser compatibles con software de código abierto mediante el uso de ella!

Consejos y advertencias

  • La única otra forma (y la mejor) es para extraer el texto (por lo general se puede copiar y pegar) y luego las imágenes en su editor HTML favorito, como NVU o incluso un documento de texto en OpenOffice.org. Una vez que todo está posicionada de la manera deseada, puede "guardar como" una página HTML o XHTML. Usted obtendrá un mejor producto final, pero vas a estar casi recreando la rueda mientras estás en ello. Si utiliza el Gimp, puede guardar el archivo PDF como una imagen. Incluso el texto se convierte en parte de la imagen. Pero, a continuación, puede insertar todo el asunto en un documento HTML.
  • No es un proceso de una etapa a menudo, y no siempre es bonito, pero estos métodos funcionan. A menos que los archivos PDF son muy complejos, debe obtener un producto final utilizable.