VLADriver-RAG:面向自动驾驶的检索增强型视觉-语言-动作模型


文档摘要

VLADriver-RAG:面向长尾驾驶场景的结构感知检索增强型视觉-语言-动作建模——深度学术解读 📋 论文基本信息 标题:VLADriver-RAG: Retrieval-Augmented Vision-Language-Action Models for Autonomous Driving 作者:Rui Zhao, Haofeng Hu, Zhenhai Gao, Jiaqiao Liu, Gao Fei ArXiv ID:arXiv:2605.08133v1(提交于2026年5月12日) 学科分类:Computer Vision (cs.CV), Artificial Intelligence (cs.


发布者: 作者: 转发
评论区 (0)
U