DeepMind: The Podcast | Episode 4: AI, Robot
La inteligencia artificial acaba de hacer que las voces de los robots suenen mucho más realistas.
DeepMind, que previamente demostró el poder de A.I. Al derrotar a un jugador humano en Go en marzo y reducir su factura de energía a la mitad en julio, ahora se centra en la síntesis de voz.
El grupo de investigación A.I, que forma parte del alfabeto de la empresa matriz de Google, reveló esta mañana que ha creado una nueva tecnología llamada WaveNet que se puede usar para generar voz, música y otros sonidos con mayor precisión que antes.
DeepMind explica que muchos métodos de síntesis de voz existentes se basan en "una base de datos muy grande de fragmentos de voz cortos que se graban desde un solo altavoz y luego se recombinan para formar enunciados completos". WaveNet, por otro lado, utiliza la "forma de onda sin formato de la señal de audio ”Para crear voces y sonidos más realistas.
Esto significa que WaveNet está trabajando con los sonidos individuales creados cuando un humano habla en lugar de usar sílabas completas o palabras completas. Esos sonidos luego se ejecutan a través de un proceso "computacionalmente caro" que DeepMind ha encontrado "esencial para generar audio complejo y de sonido realista" con las máquinas.
El resultado de todo ese trabajo adicional es una mejora del 50 por ciento en el lenguaje sintetizado en el inglés estadounidense y el chino mandarín. Aquí hay un ejemplo de voz generada usando el texto paramétrico a voz, que es común hoy en día, utilizado por DeepMind para demostrar cómo este método de síntesis de voz carece:
Y aquí hay un ejemplo de la misma oración generada por WaveNet:
A medida que las empresas continúan su trabajo en las interfaces de lenguaje natural, ofrecer respuestas más realistas será cada vez más importante. WaveNet puede ayudar a resolver ese problema.
Elon Musk despide las voces de Twitter acerca de las 5 extinciones masivas más letales
Elon Musk se tomó un tiempo fuera de su apretada agenda para advertir sobre las cinco extinciones masivas más mortíferas que jamás se haya enfrentado a la Tierra.
Las ballenas asesinas imitan voces humanas y otras ballenas en una extraña grabación
Es posible que haya escuchado loros que imitan las palabras humanas, pero los científicos dicen que una orca (Orcinus orca) puede imitar los sonidos de otra orca y un humano.
'Perdón por molestarte' Spoilers: Las caras blancas detrás de las voces blancas
Si tiene problemas para hacer coincidir las voces blancas con las caras blancas en "Perdón por molestarlo", lo tenemos cubierto. Aquí está la identidad de cada voz blanca detrás de los personajes en 'Lo siento para molestarlo'. Aquí tienes todo lo que necesitas saber sobre el reparto fuera de la pantalla.