Un A's Pyongyang Tour Series Part 1 (eng subtitled)
Tabla de contenido:
Hoy hace un año, Facebook lanzó su función "En este día". Inverso habló con Manohar Paluri, líder en investigación sobre visión por computadora de Facebook, sobre cómo la inteligencia artificial, el aprendizaje automático y la visión por computadora hacen que esta característica sea más significativa, y cómo estas áreas de investigación y desarrollo continuarán mejorando la experiencia de Facebook en los próximos años.
Incluso si no ha utilizado la función de este día, ha visto estas publicaciones en su feed de noticias; has visto a un amigo compartir un evento de su pasado en Facebook. ¡No puedo creer que hayan pasado tres años desde que ese mago sacó un conejo de un sombrero! junto con una foto de dicho mago sacando dicho conejo de dicho sombrero. Algo parecido a eso. Y hoy, Facebook está compartiendo su propia memoria. En este día, hace un año, Facebook lanzó el día de hoy. (Ahora, On This Day cuenta con más de 60 millones de visitantes diarios y 155 millones se suscriben a sus notificaciones).
Pero para Facebook, esta memoria es menos sentimental que un hito. Facebook implementa constantemente nuevas funciones, y estas funciones se examinan y modifican constantemente. A veces son los seres humanos, como Paluri y su equipo, quienes hacen los ajustes; otras veces es A.I.s. La mayoría de las veces, sin embargo, es simbiótico. Facebook es como un cyborg, y este cyborg tiene uno razón de ser: para hacer tu experiencia de Facebook como lo mas agradable posible.
La visión por ordenador, la comprensión del contenido, y A.I. El escuadrón de Facebook podría verse, por así decirlo, como la placa madre del cyborg. Y Paluri, para continuar con la metáfora, es una especie de unidad central de procesamiento para esa placa base. Paluri ha estado trabajando en la visión por computadora durante más de una década, y él no es pequeño: comenzó en SRI, pasó a los laboratorios de IBM Watson y de allí saltó a Google. Y ahora está en Menlo Park en Facebook. Cuando se unió, su proyecto de pasantía en reconocimiento visual terminó como la "columna vertebral", dice, de la tecnología de comprensión de imágenes y videos de Facebook. Y ese motor de reconocimiento visual es cada vez más central para Facebook.
"Si observas el uso de Facebook a lo largo del tiempo, y este es un ejemplo que Mark Zuckerberg también cita con frecuencia, ves que se comparten medios cada vez más ricos, y la gente usa eso para conectarse", dice Paluri. “Comienzas desde el texto, vas a las fotos; De las fotos a las que va a los videos, y de los videos, ahora vamos a la realidad virtual. A medida que el medio de comunicación se hace más y más rico, también es importante que las herramientas se pongan al día, que las herramientas entiendan qué es este contenido. A menos que tengamos eso, no podremos hacerlo mejor en el ranking de News Feed, no podremos hacerlo mejor en la recuperación de búsquedas, no podremos hacerlo mejor en la descripción de fotos para personas ciegas, no lo haremos. capaz de construir mejores mapas de densidad de población ".
La relativamente nueva centralidad de la inteligencia artificial, el aprendizaje automático y la visión por computadora, dice Paluri, es una "apuesta estratégica", pero una apuesta que lo emociona. En ningún otro lugar en el que haya trabajado tiene un circuito tan ajustado de retroalimentación y respuesta entre la investigación y la ingeniería. "Al centralizarlo, procesamos con el estado de la técnica, impulsamos el estado de la técnica, y luego los equipos de productos y el resto de la compañía pueden aferrarse a él", dice.
Ahora, Paluri maneja el equipo de visión computacional. "El objetivo de alto nivel para el equipo es hacer que las máquinas vean la forma en que los humanos lo hacen", explica Paluri. “Y vaya más allá, en realidad, vaya más allá de lo que los humanos son capaces de, por ejemplo, del reconocimiento detallado”. Publicamos nuestros hallazgos en las mejores conferencias, escribimos blogs técnicos y somos muy abiertos sobre lo que estamos trabajando. En general, nuestro objetivo principal es llevar la tecnología de visión artificial al resto de los grupos de productos en Facebook ".
Y el producto principal que está cosechando la cosecha del equipo de Paluri está en este día.
Detrás del velo simplista e inocente que se encuentra en este día se encuentra un complejo A.I. y un sistema de visión por computadora que afina tu experiencia mnemotécnica. Paluri, que, de nuevo, solo está ligado tangencialmente a On This Day, explica por qué revivir las memorias de las redes sociales puede ser bueno:
“La nostalgia es un fenómeno muy positivo. Por lo tanto, ver su foto de boda, por ejemplo, de manera improvisada, cuando no la está buscando específicamente, pero aparece en su News Feed, es una experiencia extremadamente agradable. Especialmente cuando estás navegando en el presente, y un recuerdo positivo sale del pasado ".
"La nostalgia es un fenómeno muy positivo".
Sin embargo, sin duda hay una nostalgia que cae más en el lado amargo del espectro agridulce. "Lo primero que me viene a la mente", dice Paluri, es: "¿Deben surgir todos los recuerdos? La respuesta intuitiva es no, porque depende de su estado actual, depende de esa memoria específica; Hay muchas, muchas cosas intrínsecas. Ahí es donde el A.I. La tecnología entra en escena ".
Y hay dos formas en que el A.I. entra, aquí: uno, personalización; dos, comprensión del contenido.
Con respecto a lo último, la comprensión del contenido: “Estos recuerdos son recuerdos de texto, eventos de la vida, fotos que subiste o videos que subiste. Por lo tanto, ahora tiene esta gran cantidad de contenido que tiene diferentes modalidades, y comprender lo que hay allí es extremadamente importante para poder aprender y proporcionar el conjunto correcto de memorias ".
Además, y no solo por On This Day, la comprensión del contenido y estos A.I. Los sistemas ayudan a eliminar a través de la abrumadora cantidad de información que hay en Facebook todos los días. (Piénsalo: si la fuente de noticias de Facebook se pareciera a la de Instagram, verías tal vez El dos por ciento de todos los mensajes. En su lugar, te encuentras con el contenido que probablemente te guste, o el contenido con el que pasarás mucho tiempo bebiendo. Y ayuda a filtrar el contenido objetable, como la pornografía, más que la mayoría de los sitios en línea.
"Aunque es una pérdida, les trae una memoria positiva".
Y con respecto al primero, Paluri elabora: "Para ti, tal vez, mirar los recuerdos positivos es bueno y no te gusta nada negativo. Pero para alguien más, tal vez quieran que se les recuerde el hecho de que perdieron a su gato en este día. A pesar de que es una pérdida, les trae una memoria positiva ". Y, en cierto sentido, cada usuario de Facebook tiene un perfil detrás de las cámaras altamente personalizado que sabe lo que él o ella no querrá recordar. “A medida que interactúa con los recuerdos, cuando comparte, como quiere o despide, hay un modelo de aprendizaje automático que utiliza el módulo de comprensión de contenido, junto con sus preferencias, y personaliza los recuerdos futuros que le serán entregados.. ”
Pero no se preocupe: Facebook quiere asegurarse de que no le recuerdan groseramente una ruptura o la muerte de un familiar. “No importa que tan buena sea la A.I. o la tecnología de aprendizaje automático es, todavía queremos darle control al usuario, porque al final del día, nuestro objetivo es resurgir los recuerdos que les gustan ". Los usuarios obtienen un interruptor de anulación:" Si lo saben, entre estos fechas, sucedió algo negativo, se rompieron, o algo así, queremos darles un control total para que no surjan esos recuerdos ".
Dentro de las preferencias de En este día, entonces, puedes decir No me muestres recuerdos con tal y tal porque es un humano despreciable o … de los últimos tres años que fueron miserables y de ninguna manera notables.
De cara al futuro, Paluri explica por qué está encantado de continuar trabajando en el desarrollo de estos sistemas y de mejorar la calidad de la placa base de Facebook.
Ya mencionó otras aplicaciones para sistemas de visión y comprensión de contenido dentro de Facebook. ¿Hay algo más que todavía esté en funcionamiento, que emplee estos sistemas, que le emocione?
Todas estas capacidades en los videos son algo que me emociona, seguro. Eso definitivamente ya existe; Es algo continuo, porque el video es bastante grande en Facebook. Pero creo que, en algún nivel, queremos enriquecernos cada vez más al entenderlo. La tecnología actual de visión artificial todavía no existe en términos de describir imágenes de la manera en que lo hacen los humanos. Podría decirle que esta foto tiene estas cosas, que este es el píxel que pertenece al gato, etc., pero está limitado. Todavía no entiende la relación entre las cosas, y todavía no lo describe de una manera humana.
Hay algunos trabajos que describen imágenes, se llama subtítulos de imágenes. Hay un montón de obras que salieron en los últimos dos años. Pero, si nos fijamos en los subtítulos que generan estos sistemas, son muy generales. No son descriptivos. Una de las cosas que nos gustaría, y que vendrá en el futuro desde nuestro lado, es describirlas de una manera mucho más rica. Tanto para imágenes como para video. Si tiene un video de dos minutos, no quiere una descripción de una oración; Lo que quieres es un párrafo con un sentido de tiempo para la descripción, ¿verdad? "Esto sucedió, luego sucedió, luego sucedió", ¿verdad? Esa es una buena comprensión.
Por lo tanto, estás tratando de sacarme de mi trabajo, estás diciendo. En breve.
Risas No, definitivamente no. Estoy haciendo tu trabajo más interesante.
¿Sientes que Facebook es un lugar extraño para esta investigación o es un lugar perfecto?
Creo que es un lugar perfecto, porque la comprensión del contenido está en el ADN de Facebook. Si nos fijamos en la explosión del uso de Facebook, News Feed es uno de los pilares que permitieron a Facebook ser una red social increíble en comparación con muchos otros competidores. News Feed, aún, es el principal canal de distribución.
Pero cuando vienes a News Feed, no vienes con una intención específica. Usted viene allí para obtener información. Por lo tanto, es importante para nosotros mostrarle las cosas correctas, mostrarle cosas significativas. Si va a otros servicios, tal vez va con una intención, en cuyo caso todo lo que el servicio debe hacer es dar la respuesta. Aquí, es como si te estuviera dando la pregunta. y Te estoy dando la respuesta. Por lo tanto, necesitas ser realmente bueno para que alguien regrese.
Por eso A.I. y la comprensión del contenido es el núcleo de Facebook, y por qué este es el mejor lugar para ello. Dada la cantidad de medios que hay, dada la cantidad de contenido en Facebook sobre imágenes y videos, y el cambio hacia más y más videos y VR, es el mejor lugar para hacer A.I. Investigación, visión artificial y aprendizaje automático.
No es un lugar extraño: es la lugar.
Tesla actualiza la característica de invocación poco después del bloqueo autónomo del modelo S
Tesla lanzó una nueva actualización por aire de su función de Invocación autónoma. La actualización se produce después de que un hombre de Utah afirma que Summon se estrelló contra su Tesla Model S.
Todos tenemos acceso a esta característica de Instagram que Taylor Swift utiliza notablemente
Lo que Taylor Swift tuvo primero en Instagram, ahora todos lo conseguimos. Instagram anunció el lunes una actualización que brinda a los usuarios herramientas para moderar los comentarios de sus fotos. Los usuarios pueden optar por el filtrado de comentarios, que oculta los comentarios que incluyen palabras en la lista predeterminada de palabras clave de Instagram. Instagram no está haciendo ese defecto ...
IPhone XS: ¿Es esta nueva característica de Selfie la versión de Bendgate para iPhone XS?
Después de mucho rumor acerca de las cámaras del iPhone XS y XS Max, Apple sorprendió a los espectadores cuando las fotos salieron con un efecto de suavizado de piel. Los usuarios no pueden averiguar cómo apagarlo. Los filtros de embellecimiento han existido durante años, pero el efecto no anunciado de Apple en las fotos pareció tocar un nervio con los usuarios.