Pregúntale a Siri: cómo enseña Apple a A.I. el nombre de su restaurante favorito

$config[ads_kvadrat] not found

Язык Си для начинающих / #1 - Введение в язык Си

Язык Си для начинающих / #1 - Введение в язык Си
Anonim

Apple está tratando de arreglar una barrera tanto para el idioma como para el comercio que existe actualmente entre los usuarios y Siri: tener el A.I. En realidad reconocen los nombres de las empresas locales. Su plan? Dando al sistema acceso al conocimiento de la geolocalización de los usuarios para que entienda los restaurantes, boutiques y ferreterías en vecindarios específicos.

Apple ha apodado esta técnica como "modelos de lenguaje basados ​​en geolocalización", o Geo-LM, para abreviar. Y en una publicación del blog del jueves en el Machine Learning Journal de la compañía, el equipo de reconocimiento de voz de Siri explicó que usarán esto para mostrar a la perfección información sobre su pizza local en lugar de responder con la marca registrada: "Lo siento, no entendí eso".. ”

Siri es un sistema de reconocimiento de voz automático (ASR) que consta de dos unidades, un modelo acústico y un modelo de lenguaje. El primero captura las palabras y los sonidos que se hacen cuando alguien habla, mientras que el primero determina qué tan probable es que una determinada serie de palabras estén en el idioma que se habla. En esencia, Siri es, en el mejor de los casos, adivinar a sabiendas lo que le estás preguntando.

Apple identificó dos defectos interesantes. Por un lado, ciertas palabras y nombres utilizados para negocios no se usan en el diálogo estándar, por lo que rara vez aparecen en los datos de capacitación del sistema y no pueden decir cómo los usuarios pronunciarán esas palabras o nombres.

En un intento por solucionar esto, Geo-LMs le dará a Siri acceso a lo que el blog llama "nombres de entidades". De esta manera, el asistente de voz puede predecir mejor cuándo se habla de un restaurante y no, digamos, un parque que puede comparte un nombre similar.

Apple armó su Geo-LM utilizando datos de la Oficina del Censo de los Estados Unidos de 169 áreas, que cubren el 80 por ciento de la población de los EE. UU. También construyeron un Geo-LM global para cada región que no se abarca en esas áreas. Entonces, si un usuario le pidiera a Siri que buscara una tienda de comestibles local que no estuviera cubierta por los datos del censo, usaría el Geo-LM global.

Si bien esto podría llenar algunos vacíos en Siri, Apple aún se está quedando atrás con respecto a Google, que actualmente está entrenando a su asistente de voz de próxima generación, Dúplex, que es capaz de hacer llamadas telefónicas con una voz humana hiperrealista. Aunque es importante tener en cuenta que Google también está trabajando para mejorar la capacidad del Asistente de Google para comprender varios acentos, dialectos e idiomas.

La publicación del blog no especificó cuándo se implementará esta actualización. Pero esperemos que puedas pedirle a Siri que haga un pedido a Denino's Pizza sin que haya que llamar a tu amigo Dino por error.

$config[ads_kvadrat] not found