Convex Q-Learning | Publicación