Tecnología

Inicio

¿Qué es el software de reconocimiento óptico de caracteres?

La capacidad de escanear un documento en formato legible por máquina es un ahorro de tiempo sin igual. En lugar de volver a escribir el documento, y posiblemente la inserción de los errores de su propia, escanearlo y pasando la imagen escaneada a través de un lector de software puede resultar en un documento editable con un alto grado de precisión en comparación con el original. Este proceso se llama el software de reconocimiento óptico de caracteres.

Reconocimiento óptico de caracteres

Reconocimiento óptico de caracteres (OCR) es un proceso en el que impreso o texto escrito a mano es mecánica o electrónicamente leer y se convierte en una forma reconocida por un ordenador. El proceso sofisticado considera que las formas de las letras y los compara con una biblioteca de formas similares. Cuando se produce una coincidencia, un personaje que representa el patrón se muestra en la pantalla, o puede introducirse en un archivo de computadora. OCR hace posible que un documento que va a escanear y leído por un ordenador, la creación de un archivo que puede ser editado o actuar en consecuencia de otras maneras.

Software OCR

Las aplicaciones informáticas se utiliza para la moderna aplicación OCR. El software ha avanzado desde sus primeros días, en los que los programas tenían que ser calibrado para cada fuente única se esperaba de reconocer. Está disponible en forma independiente como un programa creado específicamente para la tarea, y como un componente en software de exploración. La llegada de Internet y la computación en nube ha llevado al desarrollo de los programas de OCR basado en la Web, lo que elimina la necesidad de instalaciones de escritorio o servidores individuales.

El proceso de reconocimiento

funciones de software OCR de reconocimiento por primera vez la distinción entre las áreas claras y oscuras de la imagen escaneada. Como se descubre una distinción de luz-oscuridad, el software busca patrones reconocibles, tales como líneas verticales y horizontales, así como curvas conectadas o parciales. Si se puede reconocer un patrón como una letra u otro carácter, que busca en su base de datos para el carácter correspondiente en conjunto el lenguaje del ordenador. A continuación, pasa a este personaje en el documento o mostrarlo es el montaje. Si el software es incapaz de reconocer un carácter, puede hacer que su mejor respuesta o sustituir un carácter alternativo con el fin de mantener el proceso en marcha.

Posibles problemas con el software de OCR

Dado que el software OCR se basa en el reconocimiento de patrones, cualquier artefacto en la página que podría potencialmente afectar este proceso es una fuente de problemas. OCR funciona mejor cuando existe una clara distinción entre los personajes y el fondo del documento, lo ideal es negro sobre blanco. Color o fondos ocupados que hacen los patrones distintivo es menor puede causar problemas. Manchas, pliegues y otros daños en el documento pueden dar lugar al reconocimiento de caracteres incorrectos también.