¿Cómo funciona la tecnología de reconocimiento de voz?

October 12

La tecnología de reconocimiento de voz por lo general viene en forma de un programa diseñado para convertir la palabra hablada a texto. La tecnología de reconocimiento de voz se puede encontrar en aplicaciones tales como mensajes telefónicos automatizados, aparato de control y la entrada de datos. Voz a datos de conversión implica una serie de procesos complejos.

Conversor analógico a digital

La tecnología de reconocimiento de voz utiliza un ADC (convertidor analógico a digital) dispositivo, que convierte analógica, o continua, el voltaje en un número digital. Las palabras habladas crean vibraciones. El ADC se traduce estas vibraciones, u ondas de sonido, en datos digitales que un ordenador puede interpretar.

fonemas

La tecnología de reconocimiento de voz divide los datos digitales en segmentos más pequeños. El programa de software coincide con estos segmentos a los fonemas contenidos en el idioma especificado. Un fonema representa la unidad más pequeña de sonido utilizado para producir contrastes entre las unidades de expresión o expresiones.

Los resultados de texto

software de reconocimiento de voz intenta colocar cada fonema en un contexto basado en los otros fonemas el software que recoge inmediatamente o registros desde el altavoz. El programa de software logra esto mediante la ejecución de los fonemas a través de un modelo estadístico basado en cálculos matemáticos, llamados algoritmos, y mediante la comparación de los fonemas con una biblioteca de palabras, frases y oraciones que ha almacenado. El programa de reconocimiento de voz y luego da salida a las palabras del orador como texto o ejecuta el comando apropiado.

Tecnología

¿Cómo funciona la tecnología de reconocimiento de voz?

Conversor analógico a digital

fonemas

Los resultados de texto

También podría gustarte