3.1.2 多模态大语言模型 (MLLM) 作为高层规划器

文档摘要

3.1.2 多模态大语言模型 (MLLM) 作为高层规划器 3.1.2 多模态大语言模型（MLLM）作为高层规划器：当视觉指令被“误读”时，我们不是调参，而是重写提示的语义契约你有没有在凌晨两点盯着一段运行了十七次都失败的机器人导航日志发呆？日志里清清楚楚写着：“LLM 输出动作序列：[‘打开冰箱门’，‘取出牛奶’，‘关上冰箱门’]”，可机械臂却伸向了微波炉——还反复三次。会员。《3.1.2 多模态大语言模型 (MLLM) 作为高层规划器》收录于灏天文库文集《具身智能 (Embodied AI)》，提供技术教程、实践指南与问题解决方案，支持在线阅读、全文检索与知识沉淀，助力开发者系统化学习。文档编号30322。

该文档为会员专享，请先登录或注册后再查看

登录注册