¿Por qué A.I. Puede luchar para entender el árabe

$config[ads_kvadrat] not found
Anonim

En el mundo de la inteligencia artificial, los datos son los reyes. Cuanto más tenga, mejores serán sus herramientas, ya que los sistemas pueden "aprender" más sobre qué esperar. Pero dependiendo de la plataforma el A.I. Según los datos, algunos idiomas pueden estar mejor representados que otros, según Miriam Redi, científica investigadora de Yahoo Labs.

"Por ejemplo, como Flickr, de donde sacamos nuestros datos, algunos idiomas están muy poco representados", dijo Redi, hablando en la Cumbre de Aprendizaje Profundo de Londres el jueves. "Así que tenemos inglés, millones de imágenes para inglés, pero tal vez tenemos 100.000 para árabe".

El equipo de Redi está trabajando en una herramienta que puede identificar elementos no visibles en las imágenes, como los valores culturales y las connotaciones emocionales. La herramienta analiza el texto adjunto a las imágenes disponibles públicamente en Flickr. Con el tiempo, el A.I. comienza a comprender por qué alguien puede etiquetar una imagen como "fiesta feliz" o "momento incómodo", pero estas ideas serán cada vez más precisas a medida que la herramienta analice más imágenes.

"Desafortunadamente, la precisión para la detección de sentimientos en imágenes para idiomas árabes tiende a ser menor porque no tenemos suficientes datos", dijo Redi.

En los idiomas que tenían mayor cantidad de datos, el equipo de Redi notó algunos patrones interesantes. Las lenguas románicas como el francés y el español tendían a expresarse de manera similar, mientras que el italiano parecía ser el único idioma en el que los usuarios identificaban imágenes con el término "evasión de impuestos".

Las barreras del idioma siguen siendo un problema para A.I. los investigadores Cualquiera que haya usado Google Translate sabrá que cambiar de idioma nunca es tan simple como parece. Sin embargo, los nuevos desarrollos están cambiando las cosas, ya que Facebook anunció este verano que se estaba acercando a su sueño de una red social en un solo idioma, traduciendo automáticamente los textos para los usuarios.

Los avances en la eliminación de las barreras del idioma pueden ayudar a fomentar la comunicación internacional, pero para proyectos como el de Redi, no hay un sustituto real para los datos de sentimientos generados por el ser humano.

$config[ads_kvadrat] not found