El nuevo algoritmo del MIT puede predecir las interacciones humanas antes de que se vuelvan torpes

$config[ads_kvadrat] not found

Big data de las redes sociales para predecir el comportamiento ciudadano

Big data de las redes sociales para predecir el comportamiento ciudadano
Anonim

Nuestra incapacidad para leer a otras personas ha dado lugar a algunos fallos épicos de los cinco primeros y se han perdido besos. Incluso después de toda una vida de experiencias, las interacciones humanas son difíciles de predecir. Pero los investigadores del Laboratorio de Inteligencia Artificial y Computación del MIT piensan que pueden ayudar: con un nuevo algoritmo de aprendizaje profundo que puede predecir cuándo dos personas se abrazarán, se besarán, se darán la mano o cinco, han dado un gran paso hacia el futuro Afortunadamente desprovisto de esos momentos incómodos.

Esperan que su nuevo algoritmo, entrenado en 600 horas de videos de YouTube y programas de televisión como La oficina, Exfoliantes, Teoria del Big Bang y Amas de casa desesperadas - se puede usar para programar robots menos incómodos socialmente y desarrollar auriculares tipo Google Glass para sugerir acciones antes de que tengamos la oportunidad de perder. En el futuro que están imaginando, nunca más volverás a arruinar la oportunidad de emitir un máximo de cinco con tu compañero de trabajo.

Darse cuenta de que los robots aprenden a ser sociales de la misma manera en que lo hacemos fue clave para el éxito del algoritmo. "Los seres humanos aprenden automáticamente a anticipar acciones a través de la experiencia, que es lo que nos hizo interesados ​​en tratar de dotar a las computadoras con el mismo tipo de sentido común", dice CSAIL Ph.D. el estudiante Carl Vondrick, el primer autor de un artículo relacionado que se presentará esta semana en la Conferencia Internacional sobre Visión por Computador y Reconocimiento de Patrones. "Queríamos demostrar que solo con ver grandes cantidades de video, las computadoras pueden obtener el conocimiento suficiente para hacer predicciones consistentes sobre su entorno".

Vondrick y su equipo enseñaron las múltiples "redes neuronales" del algoritmo para analizar enormes cantidades de datos en este caso, las horas de los cinco máximos de Jim y Pam, y los besos subrepticios de Mike y Susan, por su cuenta. Teniendo en cuenta factores como los brazos extendidos, una mano levantada o una mirada prolongada, cada una de las redes neuronales adivinó lo que iba a suceder en el siguiente segundo, y el consenso general de las redes se tomó como la “predicción” final en el estudiar.

El algoritmo lo hizo bien en más del 43 por ciento del tiempo. Si bien esto puede no parecer lo suficientemente alto como para garantizar que nuestras interacciones diarias sean menos extrañas, es una gran mejora en los algoritmos existentes, que tienen una precisión de solo el 36 por ciento.

Además, los humanos solo pueden predecir acciones el 71 por ciento de las veces. Necesitamos toda la ayuda que podamos conseguir.

En la segunda parte del estudio, se enseñó al algoritmo a predecir qué objeto aparecería en la escena cinco segundos después, elementos básicos de una comedia doméstica como controles remotos, platos y botes de basura. Por ejemplo, si se abre una puerta de microondas, existe una probabilidad relativamente alta de que aparezca una taza a continuación.

Su algoritmo aún no es lo suficientemente preciso para Google Glass, pero con el coautor Antonio Torralba, Ph.D. - financiado por un premio de investigación de la facultad de Google y Vondrick trabajando con un Ph.D. de Google. compañerismo - podemos apostar a que llegue allí. Las futuras versiones del algoritmo, predice Vondrick, se pueden usar para programar robots para que interactúen con humanos o incluso para enseñar a las cámaras de seguridad a registrarse cuando una persona se cae o se lesiona.

"Un video no es como un libro" Elige tu propia aventura "donde puedes ver todos los caminos potenciales", dice Vondrick. "El futuro es intrínsecamente ambiguo, por lo que es emocionante desafiarnos a nosotros mismos para desarrollar un sistema que use estas representaciones para anticipar todas las posibilidades".

$config[ads_kvadrat] not found