Cómo construir una aplicación de reconocimiento de voz

May 18

La construcción de reconocimiento de voz en sus aplicaciones puede simplificar la introducción de texto o hacer más fácil el control de texto sin usar el teclado o el ratón. A pesar de que puede ser muy difícil construir un programa de reconocimiento de voz a sí mismo, la integración de un motor de reconocimiento de voz existente en su programa puede ser muy fácil, especialmente para aquellos con conocimientos de programación informática.

Instrucciones

Preparar software de reconocimiento de voz

1 Envuelva a su software con un programa de reconocimiento de voz, tales como Dragon NaturallySpeaking o IBM ViaVoice. Si usted es un desarrollador de software, dar al usuario la opción de comprar el software. Como parte del proceso de instalación de la aplicación, el usuario tiene instalar el programa de reconocimiento de voz también.

2 Configurar el software de reconocimiento de voz. Para que su aplicación sea capaz de sacar el máximo provecho de reconocimiento de voz, el programa de reconocimiento de voz debe estar configurado correctamente. Esto significa que la configuración del micrófono y del lenguaje deben ajustarse adecuadamente para tener ventaja óptima de las capacidades del programa de reconocimiento de voz.

3 Entrenar el programa de reconocimiento de voz. Esto puede tener que hacerse fuera de su aplicación, en función de su naturaleza. Si este es el caso, la mayoría de los programas de reconocimiento de voz incluyen programas de formación y pantallas, o el programa de reconocimiento de voz puede ser entrenado en un procesador de textos.

Integrar la entrada de texto

4 Construir un texto o control de texto enriquecido en su aplicación. Muchos de los programas de reconocimiento de voz funciona con todos los programas que tienen opciones de entrada de texto. Si todo lo que necesita es la introducción de texto, su aplicación probablemente no tendrá ninguna modificación para trabajar con un programa de reconocimiento de voz.

5 Incluir espacio adicional en el control de entrada de texto. Dado que los programas de reconocimiento de voz puede reconocer el habla a un ritmo más rápido que mucha gente puede escribir, puede ser necesario aumentar el tamaño de los controles de entrada de texto. Deje suficiente espacio para que se inserte y revisado en texto en tiempo real.

Interactuar a través de una API

6 Utilizar una interfaz de programación de aplicaciones (API) para interactuar con el software de reconocimiento de voz. Muchos de los programas de reconocimiento de voz incluyen una API para otras aplicaciones utilicen. Utilizando uno permitirá que su aplicación tenga acceso completo a todas las funciones de reconocimiento de voz y dar al usuario un control total sobre la aplicación a través del habla.

7 Integrar la API con su solicitud. Esto puede incluir la realización de más de un "modo" de control por voz. Crear palabras de comando, como "guardar archivo" o "crear nuevo archivo." Al introducir texto, los usuarios también deben ser capaces de hacer correcciones sin tener que tocar el teclado y activar las funciones de texto enriquecido, como negrita, cursiva, subrayado y otros cambios de fuente.

Consejos y advertencias

Póngase en contacto con la empresa que fabrica el software de reconocimiento de voz y preguntar si existe una API disponible. Esto no es un add-on típica con el software de reconocimiento de voz, pero si usted le dice al soporte técnico al cliente que usted está tratando de construir una aplicación de reconocimiento de voz, lo más probable es ser capaz de asegurar la API.