DeepMind A.I. Salva la brecha entre el robot y las voces humanas

$config[ads_kvadrat] not found

DeepMind: The Podcast | Episode 4: AI, Robot

DeepMind: The Podcast | Episode 4: AI, Robot
Anonim

La inteligencia artificial acaba de hacer que las voces de los robots suenen mucho más realistas.

DeepMind, que previamente demostró el poder de A.I. Al derrotar a un jugador humano en Go en marzo y reducir su factura de energía a la mitad en julio, ahora se centra en la síntesis de voz.

El grupo de investigación A.I, que forma parte del alfabeto de la empresa matriz de Google, reveló esta mañana que ha creado una nueva tecnología llamada WaveNet que se puede usar para generar voz, música y otros sonidos con mayor precisión que antes.

DeepMind explica que muchos métodos de síntesis de voz existentes se basan en "una base de datos muy grande de fragmentos de voz cortos que se graban desde un solo altavoz y luego se recombinan para formar enunciados completos". WaveNet, por otro lado, utiliza la "forma de onda sin formato de la señal de audio ”Para crear voces y sonidos más realistas.

Esto significa que WaveNet está trabajando con los sonidos individuales creados cuando un humano habla en lugar de usar sílabas completas o palabras completas. Esos sonidos luego se ejecutan a través de un proceso "computacionalmente caro" que DeepMind ha encontrado "esencial para generar audio complejo y de sonido realista" con las máquinas.

El resultado de todo ese trabajo adicional es una mejora del 50 por ciento en el lenguaje sintetizado en el inglés estadounidense y el chino mandarín. Aquí hay un ejemplo de voz generada usando el texto paramétrico a voz, que es común hoy en día, utilizado por DeepMind para demostrar cómo este método de síntesis de voz carece:

Y aquí hay un ejemplo de la misma oración generada por WaveNet:

A medida que las empresas continúan su trabajo en las interfaces de lenguaje natural, ofrecer respuestas más realistas será cada vez más importante. WaveNet puede ayudar a resolver ese problema.

$config[ads_kvadrat] not found