Tecnología

Inicio

Los mejores OCR árabe

Los mejores OCR árabe


Muchos desafíos se enfrentan a un software de reconocimiento óptico de caracteres en árabe, no menos importante de los cuales es la relativa falta de interés en comparación con los idiomas europeos. Sin embargo, la propia escritura ofrece importantes obstáculos, en forma de caracteres variables y la naturaleza interconectada de las letras. La importancia de los pequeños puntos y otros signos diacríticos para distinguir las letras idénticas por lo demás también ha demostrado ser problemática, lo que requiere escáneres para ser extremadamente sensible y el software más exigente de lo necesario para las escrituras occidentales. Sin embargo, hay algunos paquetes profesionales disponibles, varios OCR prometedores en desarrollo y muchos OCRs pequeña escala desarrollados por académicos.

Readiris Pro 12 Oriente Medio

De lejos el más exitoso software de OCR árabe en el mercado, tiene mucho mejor funcionalidad de algunas de las otras opciones, tales como ser capaz de generar una variedad de tipos de documentos, y ofrece compresión de archivos. También es bastante exacta en la lectura de la escritura árabe, incluso si el idioma es el urdu o el farsi. Sin embargo, este software en particular es parte de un paquete con muchos otros idiomas incluidos, y se produce una menor precisión de la lectura en los idiomas que otros OCRs disponibles.

Lector de Oro o Platino automática

Algo menos conocido, pero considerablemente más especializada, es lector automático de AramediA. Tiene menos campanas y silbidos, pero sí incluye mucho mejor procesamiento del lenguaje natural específicamente para el árabe. El fondo de desarrolladores involucrados en la fabricación de este software incluye algunos pesos pesados ​​en las tecnologías de procesamiento del lenguaje, por lo que esta podría ser una sorpresa. Es compatible con el árabe por defecto, y un plug-in está disponible para apoyar persa, Jawi, pashto y urdu, dando un espectro más amplio de lenguajes de script árabes apoyados que Readiris Pro.

OCRs elaborado universitarios

Hay una serie de OCR lengua y escritura árabe disponible, a veces poco o ningún costo, que puede ser una gran ventaja sobre los paquetes profesionales. Algunos de estos también tienen la ventaja de años - un poco más de una década - de desarrollo, así como un enfoque en la precisión del lector y la comprensión del lenguaje. Sin embargo, también son generalmente más bien lento y carece de otras características. los más recientes en particular, han sido beneficiarios de una gran base de datos de muestras manuscritas - conocidos como ARABASE - y desarrollos en la tecnología de inteligencia artificial.

OCRs en Desarrollo

Un puñado de OCR árabe prometedores se fija para ser lanzado en el 2011 o 2012, que incorpora lo mejor del software profesional y los últimos desarrollos académicos. Si se comunica con las empresas directamente, puede ser capaz de obtener una versión beta. Hay dos OCR especialmente prometedores en esta categoría - uno basado en el sistema ORAN, desarrollado en la Universidad Rey Fahd de Arabia Saudita, y uno conocido como Clever página, que saldrá en noviembre de 2011 y con el apoyo de un fondo de Colaboración egipcia Tecnología de la Información Academia.