Tecnología

Inicio

Los documentos OCR TIFF y Errores

Los documentos OCR TIFF y Errores


El Tagged Image File Format, o TIFF, sirve como una opción frecuente para guardar archivos de mapas de bits sin comprimir, incluyendo imágenes adquiridas a partir de material impreso de exploración. Puede crear archivos TIFF y ejecutar el Reconocimiento óptico de caracteres en las páginas del tipo que desea capturar en forma de texto en vivo. Si el archivo TIFF no cumple las especificaciones de OCR, el software de OCR muestra un mensaje de error que indica que el archivo no se puede procesar correctamente o en absoluto.

TIFF compresión

El formato de archivo TIFF le permite aplicar la compresión de imágenes sin pérdida cuando se guarda documentos en un programa de software que incorpora soporte para los sistemas de compresión de archivos. Estas opciones pueden disminuir el tamaño de su archivo, pero no todos los programas de OCR apoyar a todos, o cualquier, tipos de compresión TIFF. Para obtener los mejores resultados, guardar los archivos TIFF sin compresión para que sean tan fáciles de usar como sea posible.

Baja resolucion

Si está familiarizado con la resolución utilizada para mapas de bits en las páginas Web, usted puede preguntarse por qué un archivo de 72 píxeles por pulgada que se ve bien cuando se ve en un navegador Web produce resultados de baja calidad en su programa de OCR. Esto se debe a que su software de OCR necesita un archivo que dedica suficientes píxeles para cada carácter de texto para que sea reconocible por los algoritmos que procesan las imágenes. Para obtener los mejores resultados, es necesario al menos un escaneo de 150 ppp, si no más. La apertura de un barrido de 72 ppi y remuestreo con 300 ppi sólo hace que el archivo más grande sin mejorar la calidad de la imagen. Para obtener los mejores resultados, comience con alta resolución o volver a explorar para alcanzar dicho objetivo.

Imágenes torcidos

Es difícil establecer una hoja de papel sobre la cubierta de formación de imágenes de un escáner sin la hoja de la deriva un poco torcida en la superficie lisa de vidrio. Los momentos que pasas el reposicionamiento de la hoja para que pueda obtener una imagen de buena calidad pagar en mejores resultados de OCR. Incluso una clara escaneo torcido quebradizo pone una mayor tensión en su programa de OCR que uno que ha capturado directamente hacia arriba y hacia abajo. Para obtener los mejores resultados, bajar la tapa del escáner con cuidado lo que el movimiento del aire no moleste a su papel.

Otras Consideraciones

Dependiendo del programa OCR que utilice, puede encontrar mensajes de error debido a sus archivos TIFF utilizan un modo de color que su software de OCR no es compatible. Por ejemplo, si se ha capturado una alta resolución, archivo RGB de 16 bits para su uso en un proyecto de retoque, su programa OCR puede frustrar en el tamaño del archivo o su profundidad de bits. Exploraciones de páginas que incluyen fotografías o dibujos resultar problemático para algunos software de OCR, que puede presentar un mensaje de error que refleja el contenido de la página, no el formato de archivo. Por último, si el análisis representa el texto en una hoja de papel de color, es posible que tenga problemas para capturar su texto porque carece de suficiente contraste en contra de su fondo.