Algoritmo que dominó 'Pong' ahora excelente en 'Flappy Bird', todavía soltero

$config[ads_kvadrat] not found

OLL алгоритмы - "Домино" #2 | OLL algorithms | oll | AJSCUBER | all oll algorithms

OLL алгоритмы - "Домино" #2 | OLL algorithms | oll | AJSCUBER | all oll algorithms
Anonim

Mejora en un método de aprendizaje profundo pionero para Apestar, Invasores espaciales y otros juegos de Atari, el estudiante de ciencias de la computación de la Universidad de Stanford, Kevin Chen, creó un algoritmo bastante bueno en el clásico desplazamiento lateral 2014 Pájaro flappy. Chen ha aprovechado un concepto conocido como "q-learning", en el que un agente pretende mejorar su puntuación de recompensa con cada iteración de juego, para perfeccionar un juego casi imposible e increíblemente adictivo.

Chen creó un sistema en el que su algoritmo se optimizó para buscar tres recompensas: una pequeña recompensa positiva por cada cuadro que permaneció con vida, una gran recompensa por pasar por una tubería y una recompensa igualmente grande (pero negativa) por morir. Así, motivada, la llamada red deep-q puede superar a los humanos, según el informe que escribió Chen: "Pudimos jugar el juego con éxito" Pájaro flappy aprendiendo directamente de los píxeles y la puntuación, logrando resultados sobrehumanos ".

El papel original de Atari, publicado en 2015 en. Naturaleza, vino de la compañía DeepMind, propiedad de Google (ahora famosa por su dominio del antiguo juego de mesa chino Go). El logro de DeepMind fue un gran avance ya que tomó información visual o de píxeles, al menos, y, con un mínimo de información, pudo maximizar las recompensas. Este sistema de recompensa se ha comparado con la respuesta dopaminérgica del cerebro, simplemente simplificada.

No es la primera vez que un algoritmo ha conquistado al ave batiente: una clase anterior de estudiantes de ciencias de la computación de la Universidad de Stanford creó un programa que, cuando se entrenó de la noche a la mañana, su puntuación mejoró de 0 canalizaciones a 1,600.

$config[ads_kvadrat] not found