Tecnología

Inicio

Cómo leer un archivo DOC Uso de PHP

Cómo leer un archivo DOC Uso de PHP


los programadores de PHP son a menudo buscan maneras de extender la funcionalidad de este lenguaje fuera de su zona de confort. PHP se utiliza sobre todo en los sistemas operativos Linux, pero los visitantes de sitios web PHP son por lo general trabajando en sistemas Windows o Macintosh. Un sitio web diseñado para cargar un archivo de Microsoft Word a partir de estos usuarios pueden necesitar para extraer el contenido de este archivo y correo electrónico o procesar su texto usando algoritmos de PHP. Sin embargo, los archivos de Microsoft Word, que terminan en la extensión DOC, no son nativas de Linux o PHP. Uniendo estos dos entornos informáticos es posible con un poco de preparación.

Instrucciones

1 Verifique con su proveedor de alojamiento que el acceso PHP está disponible para su sitio web. La mayoría de los servidores soportan PHP, pero en ocasiones este servicio requiere una actualización de la cuenta. No se puede leer un archivo DOC usando PHP sin acceso al compilador.

2 Descargar la utilidad lector de documentos Antiword MS Word (ver Referencias). Este programa de código abierto contiene materiales de programación que se extienden PHP para la conversión de DOC.

3 Descomprimir el archivo Antiword para extraer su contenido.

4 Sube toda la biblioteca de archivos Antiword al servidor web. Colocar los archivos en el directorio "bin" de la cuenta de host. Este directorio es un repositorio común para los servicios públicos y otras operaciones binarias que los usuarios del servidor Web debe explotar con frecuencia.

5 Llamar al programa Antiword en cualquier script PHP diseñado para leer un documento de Microsoft Word DOC. El comando se implementa utilizando una única función. Tipo "content = $ shell_exec ( '/ usr / local / bin / antiword' $ nombre de archivo.);" donde "$ archivo" es igual al nombre de archivo completo del documento DOC. El contenido del archivo DOC serán leídos en la variable "$ contenido". Estos nombres de variables, comenzando con el símbolo "$", se pueden personalizar.

6 Procesar la variable "$ contenido" como se desee para manipular el contenido del archivo DOC. Una vez que el DOC es leído por PHP, el texto completo del archivo está disponible para cualquier tipo de actividad adicional. Los contenidos pueden ser enviados por correo electrónico o almacenar en una base de datos, por ejemplo.

Consejos y advertencias

  • configuraciones de servidor varían entre los proveedores de alojamiento. Es posible que el directorio "bin" para su cuenta reside en un lugar diferente que el código de ejemplo que se incluye aquí. La ruta del directorio "bin" puede ser algo distinto de " '/ usr / local / bin". Si es así, ajustar el comando "shell_exec" para adaptarse al entorno particular de su cuenta de servidor.