Tecnología

Inicio

Cómo convertir de HTML a texto en Java

Cuando se trabaja con Java, que puede ser especialmente útil para convertir rápidamente código HTML existente en código Java utilizable. Por desgracia, la conversión manual de HTML a Java es un proceso que consume tiempo y requiere más trabajo no productivo que el libro-inteligencia, lo que lleva a muchos programadores a convertirse rápidamente frustrado. Afortunadamente, hay una, de código abierto analizador de HTML libre para Java que se puede utilizar para convertir automáticamente HTML a Java sin problemas. Configuración del analizador es bastante simple, y sólo debe tomar un corto periodo de tiempo para aprender y dominar.

Instrucciones

1 Vaya a la página de descarga NekoHTML (ver enlace en Recursos).

2 Descargar la última revisión del analizador nekoHTML.

3 Descomprimir el archivo nekoHTML, a continuación, añadir el "nekohtml.jar" archivo a la "ruta de clases" desde el directorio nekohtml extraído.

4 Navegar a la página de descarga Xerces Java Parser (ver enlace en Recursos).

5 Descargar la última revisión del analizador Xerces en su disco duro local.

6 Descomprimir el archivo "Xerces-J-bin.2.9.1". A continuación, añadir el archivo "xercesImpl.jar" a la "ruta de clases" desde el directorio Xerces extraído. Una vez que ambos .JARs se han añadido correctamente a la CLASSPATH, usted debe ser capaz de analizar cualquier código HTML cuando sea necesario.

Consejos y advertencias

  • Si se encuentra con problemas para utilizar el analizador, asegúrese de que ha desempaquetado los archivos JAR a la ubicación correcta, y que la ruta del archivo en Java es correcta.