I finally made GARUM | Ancient Rome's favorite condiment
Bradley Hayes, un asociado postdoctoral en el MIT que realiza investigación robótica, acaba de convertir a Donald "Drumpf" Trump en un robot. Programó una red neuronal recurrente, una inteligencia artificial, para estudiar y emular los discursos del candidato republicano.
El "día de trabajo de Hayes", dice, es "una investigación centrada en la formación de robots humanos: diseñar algoritmos que permitan a los robots trabajar y aprender de los humanos para que puedan ser más seguros, más eficientes y más efectivos en sus trabajos". es un "proyecto paralelo". Se inspiró, en parte, en el "fantástico boceto" de John Oliver. ("Espero que vea esto, espero que vea esto y lo aprecie")
Inverso Hablé con Hayes sobre este esfuerzo patriótico.
¿Qué más te inspiró para hacer @DeepDrumpf?
Surgió de una conversación a la hora del almuerzo con algunos de mis colegas que también hacen investigación robótica y se ocupan del aprendizaje automático. Estábamos hablando de varias técnicas de modelado estadístico que eran realmente relevantes para nuestra investigación.Resulta que la misma técnica que está detrás de DeepDrumpf funciona en muchos dominios de robótica, porque es una técnica de modelado que trata de aprender la estructura de la información secuencial o los datos secuenciales. El lenguaje natural es un gran ejemplo de datos secuenciales, donde la estructura de la oración es bastante consistente: hay reglas y hay una estructura subyacente de todos los datos que está obteniendo.
¿Heredar 100 millones? Y ahora estoy construyendo en todo el mundo. Y tengo un poco de frío.
- DeepDrumpf (@DeepDrumpf) 4 de marzo de 2016
Un investigador diferente de Stanford escribió un curso sobre redes neuronales y, en particular, publicó un artículo titulado “La efectividad irrazonable de las redes neuronales recurrentes”. Entonces, escribió esta fantástica introducción a esta técnica de modelado estadístico y un montón de la gente ha demostrado que tiene este poder irrazonable para representar la estructura en este tipo de escritura de datos de texto de forma libre.
Vi un artículo que comparaba la complejidad del discurso de los principales candidatos políticos. El artículo decía cómo Trump está usando un lenguaje más simplista, y es un gran éxito con su grupo demográfico y sus seguidores. Desde una perspectiva política, eso es realmente genial, ya que deja su mensaje claro y al alcance de la audiencia más amplia posible; Desde el punto de vista del aprendizaje automático, eso significa que este podría ser el modelo más manejable que podemos hacer.
¿Has oído hablar de un lenguaje de codificación llamado "Make Python Great Again"?
Ya sabes, lo vi ayer. TrumpPython o algo así? Yo vi eso. Leí un artículo al respecto, fui a su página de GitHub, pero aún no he tenido tiempo de jugar con él. Pero se ve genial.
¿Podemos aprender algo de las tendencias lingüísticas de Trump, o algo así, de su A.I.?
Sí, es posible en el sentido de que, si observa la salida del modelo, es indicativo de la estructura que el modelo ha aprendido de los datos. Entonces, el tipo de repetición, el tipo de cosas que salen del modelo, le informarán, potencialmente, sobre ciertas cosas que son inherentes a sus patrones de habla y su mensaje.
Kansas Todos dijeron: "No necesito nada. Tenían un país horrible, y tiene la infraestructura especial, nuestro país necesita un rico.
- DeepDrumpf (@DeepDrumpf) 4 de marzo de 2016
No necesariamente podría obtener eso desde la propia cuenta de Twitter, principalmente porque Twitter solo le da 140 caracteres para trabajar. Y, debido a que no hay una gran cantidad de datos que han entrado en el modelo, y también parcialmente porque las transcripciones son de debates, donde los candidatos (y especialmente Trump) tienden a interrumpirse a sí mismos - hace que estas discontinuidades en la salida.
Todavía se necesita un poco de trabajo manual para muestrear básicamente un muro de texto de este modelo y luego analizarlo y seleccionar el mejor nugget contiguo de 140 caracteres, y luego publicarlo.
Este es un negocio. Nuestro presidente es Obamacare. Ahora, en esto es lo que no es. Muchas gracias. No somos una animadora, somos interesantes.
- DeepDrumpf (@DeepDrumpf) 4 de marzo de 2016
¿Así que no es muy difícil en este punto?
Aprende efectivamente como distribución de probabilidad, y puedes muestrear de ella. Lo que eso significa es que tienes tu modelo y puedes pedirle una carta. Y, si le pide suficientes letras seguidas, le dará cosas que se parecen al inglés. O, mejor aún, algunos de ellos se asemejan a cosas que Trump podría haber dicho en realidad, porque fue entrenado en él. Por lo tanto, el proceso general que he estado siguiendo es: muestrear, digamos, 500 o 1,000 caracteres de él. Simplemente me daría un muro de texto con un valor de 500 o 1,000 caracteres, supongo, divagaciones, y luego, dentro de eso, solo elegiré el mejor bloque de 140 caracteres que tenga sentido. O la mejor frase que sale de ella que parece algo relevante.
Por ejemplo, anoche lo estaba usando para twittear en vivo el debate. Y así, una de las cosas que puedes hacer con un modelo como este es que puedes prepararlo. Por lo tanto, debido a que el modelo solo le da un carácter a la vez, depende de los caracteres anteriores, las letras que generó anteriormente. Así es como aprende las palabras, así es como captura la estructura de la oración y ciertos elementos de la gramática.
Digamos que comienzo mi oración con ‘Romney is’ y luego pregúntele por los próximos mil caracteres. A eso lo llamamos priming. Dará la salida que desee, pero establecerá la parte inicial de la secuencia para que "Romney sea …"
¿Es eso referenciar esos tweets con frases entre corchetes?
Exactamente correcto.
Romney es una herramienta. Quiero decirte esto. Probablemente sean lo último que necesitamos en un líder. No podemos hacer eso.
- DeepDrumpf (@DeepDrumpf) 3 de marzo de 2016
Una de las cosas que espero hacer, una vez que el proceso sea un poco más limpio (y eso va a venir con más datos) es comenzar a interactuar con los otros candidatos. Si miras la cuenta de Twitter, está siguiendo a los otros candidatos principales. Con el tiempo, es de esperar que comience a responderles y tal vez a desafiarlos. Pero eso es más como un tipo de proyecto de fin de semana.
@realDonaldTrump Van a pagar en este momento, y como, absolutamente. Soy muy rico Oh quiero apoyarlos y tenerlos.
- DeepDrumpf (@DeepDrumpf) 3 de marzo de 2016
¿Puede explicar qué es una red neuronal recurrente en un lenguaje simplista y no especializado?
Claro, lo intentaremos. Una red neuronal, en general, está recibiendo algo de entrada, luego está haciendo algunas matemáticas en el medio, y le da una salida. En general, es sólo un clasificador. Entonces, dada alguna entrada, te dirá a qué clase corresponde esa entrada. Un ejemplo popular sería - una red neuronal básica - le das una foto de un gato, y quieres que te diga que - si es, como, un gato, un perro, un avión o un automóvil, quieres es decir, "está bien, con mucha confianza, este es un gato que me acabas de dar".
Así que esa es la tarea de clasificación de alto nivel. Este es un concepto similar, pero en lugar de ser gato, perro, automóvil, las clases son las letras individuales del alfabeto y la puntuación. Por lo tanto, está tomando una entrada y luego le está haciendo matemáticas basándose en lo que aprendió, por lo que todo el aprendizaje ocurre "en el medio", lo llamaremos, y le da una clasificación al final. Asi como, esta carta.
Lo que lo hace un recurrente La red neuronal es que la salida de los pasos anteriores se alimenta al siguiente paso como parte del modelo. El hecho de que el modelo me haya dado una "M" se incorporará a la próxima revisión del modelo. Entonces, podría darte una "a" y luego una "k" y luego una "e" porque está tratando de poner "Make America great otra vez", porque eso está representado mucho en los datos.
¿Estás particularmente orgulloso de los tweets de DeepDrumpf hasta el momento?
Si, en realidad Tengo una pareja que todavía no he publicado, pero -
Exclusivo.
Risas Exactamente. De los que están publicados, estoy particularmente contento con "Soy lo que ISIS no necesita".
Soy lo que ISIS no necesita.
- DeepDrumpf (@DeepDrumpf) 3 de marzo de 2016
A ver … lo sembré con "No soy racista, pero …" y la continuación de eso fue "… créelo", lo que me pareció bastante excelente. Lo iba a guardar para cuando se hiciera relevante, si se volvía relevante.
Nada bueno viene después de esas palabras.
¿Prefiere votar por Donald Trump o votar por @DeepDrumpf?
Creo que hay compensaciones con cada una de esas opciones.
'Wreck-It Ralph 2' Stan Lee Cameo: Esto es lo que sucede en la nueva película
¿Tiene Stan Lee un cameo en 'Ralph Breaks the Internet: Wreck-It Ralph 2' de Disney? La respuesta corta es ... más o menos. Esto es lo que necesita saber sobre su primera oportunidad de ver la leyenda del cómic en los cines después de su inesperada muerte el lunes.
Google lo hizo más fácil para que las aplicaciones de tu iPhone se horneen con inteligencia artificial
TensorFlow de Google es la plataforma de código abierto que subyace en gran parte del aprendizaje automático realizado en Internet. Gmail, Google Photos, Search, e incluso el programa que mejoró al campeón del mundo en el juego de Go, confían en alguna versión de TensorFlow para funcionar, y ahora se está abriendo a los desarrolladores de iOS. Googl ...
Los Redditors nos dicen qué sucede cuando sales con una stripper
Al igual que te preguntas qué pasa cuando sales con un CEO, la gente pregunta cómo es salir con una stripper. Y Reddit, una vez más, responde.