Reconocimiento de voz de Microsoft es "casi humano''
Microsoft
logro por primera vez que una computadora hiciera una transcripción de una conversación con el mismo margen de error que los seres humanos.
“Hemos llegado a la paridad humana,”
dijo el Jefe de científicos del habla en Microsoft, Xuedong Huang. Un ser humano tiene la capacidad de transcribir una conversación con la posibilidad de perder el 5.9 por ciento de lo que esta escuchando.
Microsoft logró construir un modelo de lenguaje neural parecido a las nubes de asociaciones de palabras, lo que permite reconocer palabras dentro de un contexto.
El equipo utilizó el sistema de aprendizaje computarizado profundo de Microsoft para desarrollar su algoritmo de grabación; esperan poder utilizarlo en situaciones de la vida real como en calles con mucho tránsito o mientras se maneja, además de aplicarla en conversaciones simultáneas.