Microsoft Research inventa el reconocimiento de voz mejor que el humano

Dictado por voz en windows 10

Microsoft se ha convertido en la primera compañía del mundo en desarrollar un software de reconocimiento de voz que es más preciso que los humanos. En el documento "Alcanzando la paridad humana en el reconocimiento del habla conversacional", publicado el lunes, el software produjo transcripciones que contenían la mitad de los errores menos que los esfuerzos humanos, lo cual es increíble si se tiene en cuenta la capacidad de las personas para entender el habla. El avance abre la puerta para el nuevo A.I. Asistentes que son más precisos que nunca.

Es impresionante lo lejos que ha llegado la tecnología en tan poco tiempo. No hace mucho tiempo, el reconocimiento de voz por computadora era un nicho extraño que parecía desesperadamente distante. Vea esta demostración del software de voz de Windows Vista de 2006:

El equipo utilizó la prueba 2000 del Instituto Nacional de Estándares y Tecnología (NIST), utilizada en toda la industria para medir la confiabilidad de las transcripciones de voz. Una conversación se lleva a cabo entre dos participantes por teléfono, turno por turno, antes de que la secuencia de comandos resultante sea comparada y verificada contra la ortografía del diccionario.

En la parte de la centralita, donde dos extraños hablan por primera vez, la tasa de error humano es de alrededor del 5,9 por ciento, mientras que en la parte de llamadas a casa, donde hablan dos personas que se conocen, la tasa de error es de alrededor del 11,3 por ciento. El software de Microsoft obtuvo una tasa de error inferior en un 0,4 por ciento.

El avance ayudará a traer nuevas formas de inmersión A.I.. En agosto, el estudiante Joshua Browder se quitó el envoltorio de su chatbot DoNotPay, que puede ayudar a las personas sin hogar a obtener asesoramiento legal gratuito. Combinado con los avances en el reconocimiento, es fácil imaginar un futuro en el que las personas le piden ayuda a un asistente virtual con la vivienda mediante una conversación regular con su computadora.

En esta etapa, los investigadores están considerando cómo el reconocimiento de voz de A.I. puede dar respuestas más inteligentes. Sensay, un detective de ira A.I. del laboratorio detrás de Siri, utiliza capacidades de reconocimiento avanzadas para detectar si un usuario se siente enojado o confundido, cambiando sus respuestas para adaptarse a la situación. Eliminar la barrera del reconocimiento de voz propenso a errores, crea nuevas y emocionantes oportunidades para la asistencia virtual.

El software de reconocimiento de perros de Microsoft no tiene idea de lo que es un perro

Si aún no lo ha hecho, vaya a What Dog Dot Net (what-dog.net), un sitio web que ha estado colectivamente moviendo la pata de Internet desde la tarde del jueves. De las mismas mentes de Microsoft que nos trajeron ese sitio web que predice incorrectamente tu edad, este programa a veces adivina correctamente la raza de tu perro ...

La comprensión del lenguaje natural es el futuro de A.I. Reconocimiento de voz

¿Qué sigue para la comprensión del lenguaje natural y las interfaces de voz conversacionales? Hay varias empresas de cuello y cuello en esta carrera.

Probamos el reconocimiento de voz sobre foto de Facebook con imágenes gráficas

Hoy, Facebook implementó una función llamada texto alternativo automático que hace que la calidad de las imágenes de las redes sociales sea más accesible para las personas ciegas o con discapacidad visual. Mediante la función VoiceOver de iOS, la tecnología de reconocimiento de objetos de Facebook enumera los elementos que puede contener una imagen en cuestión. Específicamente, esos ...

$config[ads_kvadrat] not found