Tecnología

Inicio

¿Cómo funciona el OCR?

¿Qué es el OCR?

Reconocimiento óptico de caracteres, más comúnmente conocido como OCR, es la interpretación de las imágenes escaneadas de texto escrito a mano, mecanografiada o impresa en texto que pueden ser editados en un ordenador. Hay varios componentes que trabajan juntos para realizar el reconocimiento óptico de caracteres. Estos elementos incluyen identificación de patrones, la inteligencia artificial y visión artificial. La investigación en esta área continúa, el desarrollo de índices de lectura más eficaces y con mayor precisión.

Los dos sistemas principales que se utilizan para realizar OCR son "coincidencia de la matriz" y "extracción de características." coincidente Matrix es el más simple y el más común, así como el más limitada, de los dos.

Coincidencia de matriz

coincidente Matrix (también conocido como la coincidencia de patrones) asocia lo que el escáner percibe como un personaje con una colección almacenada de patrones de mapa de bits o contornos de caracteres. Cuando una imagen corresponde a uno de estos mapas de bits seleccionados dentro de un cierto grado de semejanza, el programa identifica esa imagen como el carácter de texto sin formato equivalente. Un inconveniente evidente de este sistema es que sólo se puede utilizar para las fuentes y tamaños en su repertorio.

Extracción de características

Extracción de características también se conoce como el reconocimiento inteligente de caracteres (ICR), o análisis de características topológicas. Es un tipo de reconocimiento óptico de caracteres que no se basa en la adaptación precisa para establecer plantillas. El programa busca elementos comunes como espacios abiertos, cerrados formas, líneas diagonales que se cruzan - y así sucesivamente.