Two steps reinforcement learning | Publicación