Video Object Linguistic Grounding | Publicación