VLADriver-RAG：面向自动驾驶的检索增强型视觉-语言-动作模型

文档摘要

VLADriver-RAG：面向长尾驾驶场景的结构感知检索增强型视觉-语言-动作建模——深度学术解读 📋 论文基本信息标题：VLADriver-RAG: Retrieval-Augmented Vision-Language-Action Models for Autonomous Driving 作者：Rui Zhao, Haofeng Hu, Zhenhai Gao, Jiaqiao Liu, Gao Fei ArXiv ID：arXiv:2605.08133v1（提交于2026年5月12日）学科分类：Computer Vision (cs.CV), Artificial Intelligence (cs.