Microsoft Research inventa el reconocimiento de voz mejor que el humano

$config[ads_kvadrat] not found

Dictado por voz en windows 10

Dictado por voz en windows 10
Anonim

Microsoft se ha convertido en la primera compañía del mundo en desarrollar un software de reconocimiento de voz que es más preciso que los humanos. En el documento "Alcanzando la paridad humana en el reconocimiento del habla conversacional", publicado el lunes, el software produjo transcripciones que contenían la mitad de los errores menos que los esfuerzos humanos, lo cual es increíble si se tiene en cuenta la capacidad de las personas para entender el habla. El avance abre la puerta para el nuevo A.I. Asistentes que son más precisos que nunca.

Es impresionante lo lejos que ha llegado la tecnología en tan poco tiempo. No hace mucho tiempo, el reconocimiento de voz por computadora era un nicho extraño que parecía desesperadamente distante. Vea esta demostración del software de voz de Windows Vista de 2006:

El equipo utilizó la prueba 2000 del Instituto Nacional de Estándares y Tecnología (NIST), utilizada en toda la industria para medir la confiabilidad de las transcripciones de voz. Una conversación se lleva a cabo entre dos participantes por teléfono, turno por turno, antes de que la secuencia de comandos resultante sea comparada y verificada contra la ortografía del diccionario.

En la parte de la centralita, donde dos extraños hablan por primera vez, la tasa de error humano es de alrededor del 5,9 por ciento, mientras que en la parte de llamadas a casa, donde hablan dos personas que se conocen, la tasa de error es de alrededor del 11,3 por ciento. El software de Microsoft obtuvo una tasa de error inferior en un 0,4 por ciento.

El avance ayudará a traer nuevas formas de inmersión A.I.. En agosto, el estudiante Joshua Browder se quitó el envoltorio de su chatbot DoNotPay, que puede ayudar a las personas sin hogar a obtener asesoramiento legal gratuito. Combinado con los avances en el reconocimiento, es fácil imaginar un futuro en el que las personas le piden ayuda a un asistente virtual con la vivienda mediante una conversación regular con su computadora.

En esta etapa, los investigadores están considerando cómo el reconocimiento de voz de A.I. puede dar respuestas más inteligentes. Sensay, un detective de ira A.I. del laboratorio detrás de Siri, utiliza capacidades de reconocimiento avanzadas para detectar si un usuario se siente enojado o confundido, cambiando sus respuestas para adaptarse a la situación. Eliminar la barrera del reconocimiento de voz propenso a errores, crea nuevas y emocionantes oportunidades para la asistencia virtual.

$config[ads_kvadrat] not found