Microsoft anunció este martes que, por primera vez, lograron que una computadora hiciera una transcripción de una conversación con el mismo margen de error que los seres humanos.
“Hemos llegado a la paridad humana,” dijo el Jefe de científicos del habla en Microsoft, Xuedong Huang. Un ser humano tiene la capacidad de transcribir una conversación con la posibilidad de perder el 5.9 por ciento de lo que esta escuchando.
El equipo de Microsoft logró construir un modelo de lenguaje neural parecido a las nubes de asociaciones de palabras, lo que permite reconocer palabras dentro de un contexto. Por ejemplo, la palabra “carrera” tiene más posibilidades de relacionarse con la palabra “rapidez” que con “lentitud”.
El equipo utilizó el sistema de aprendizaje computarizado profundo de Microsoft para desarrollar su algoritmo de grabación; esperan poder utilizarlo en situaciones de la vida real como en calles con mucho tránsito o mientras se maneja, además de aplicarla en conversaciones simultáneas.
Con información de Engadget.