【周刊客服】

李想再谈VLA司机大模型：终极是像人类司机一样工作

2025/05/08 | 作者曹杨 | 编辑郝琳

摘要：5月8日，理想L系列智能焕新版车型正式发布，包含L7、L8、L9三款车型，以及此前在上海车展发布的L6智能焕新版。

2025年5月8日，理想L系列智能焕新版车型正式发布，包含L7、L8、L9三款车型，以及此前在上海车展发布的L6智能焕新版。其中，理想L6智能焕新版售价24.98万-27.98万元，理想L7智能焕新版售价30.18万-35.98万元，理想L8智能焕新版售价32.18万-37.98万元，理想L9智能焕新版售价40.98万-43.98万元。

此次智能焕新版车型主要围绕外观造型、底盘、辅助驾驶、智能座舱等软硬件功能进行升级。

图/理想汽车官方

外观方面，理想L6智能焕新版新增天青色外观颜色，理想L7和L8智能焕新版新增蓝灰外观颜色，理想L9智能焕新版新增雅灰外观颜色。

底盘升级方面，理想L7和L8智能焕新版全系搭载双腔魔毯空气悬架；理想L9智能焕新版搭载行业前沿的双腔双阀魔毯空气悬架，成为首款搭载双腔空气弹簧+双阀减震器的中国品牌SUV。

相较于外观和底盘的升级，辅助驾驶方面的升级是这次发布会的重中之重。

L系列智能焕新版全系迎来辅助驾驶芯片升级，AD Max升级NVIDIA最新Thor-U芯片，是全球首个大规模量产交付NVIDIA Thor-U芯片的高级辅助驾驶平台；AD Pro升级新一代地平线征程®6M芯片。

此外，理想方面提到，今年下半年，理想汽车高级辅助驾驶将升级为新一代VLA（Vision-Language-Action Model，视觉语言行动模型）司机大模型。

在产品发布会前一天，理想举办了“理想AI Talk”第二季的直播，这次直播距离上一次“理想AI Talk”已经过去了130天。

在这长达4个多月的时间里，整个AI产业都发生了翻天覆地的变化，DeepSeek横空出世，搅动了全球人工智能的发展，理想也成为了受益者之一。

“DeepSeek的出现对加速VLA（视觉语言行动模型）是巨大的帮助。理想原本计划于2025年9月完成的VLA语言模型部分，因直接采用DeepSeek的开源框架，研发进度提前了9个月。”理想汽车董事长兼CEO李想在“理想AI Talk”第二季上说道。

VLA架构被李想看成是辅助驾驶发展的必然结果，但在谈到“VLA司机大模型的作用、训练方法和挑战”时，李想直言，VLA的实现不是突变的过程，而是进化的过程，经历了三个阶段，对应理想汽车辅助驾驶的昨天、今天和明天。

图/理想汽车官方

第一阶段，理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶，类似“昆虫动物智能”。

第二阶段，理想汽车自2023年起研究，并于2024年正式推送的端到端+VLM（Vision Language Model，视觉语言模型）辅助驾驶，接近“哺乳动物智能”。

端到端模型在处理复杂问题时存在局限，虽可借助VLM视觉语言模型辅助，但VLM使用开源模型，使其在交通领域的能力有限。

在端到端的基础上，到第三阶段，VLA将开启“人类智能”的阶段。对于李想这段话更直接的理解，就是“未来的VLA就是一个像人类司机一样工作的司机大模型”。

就像人类想要成为一个技术高超的老司机，需要积累丰富的驾驶经验一样，VLA想要成为“VLA司机大模型”，也要经过VL（视觉语音）基座预训练、辅助驾驶后训练、辅助驾驶强化学习和司机Agent（智能体）四个阶段的训练和推理过程，从而让用户可通过自然语言与司机Agent沟通，实现“跟人类司机怎么说，就跟司机Agent怎么说”。

除了提升专业能力，VLA司机大模型更需要解决安全性和模型黑盒的问题，从而保障VLA司机大模型能够实现职业司机般的安全和舒适，避免学习加塞等违规行为。

李想表示，判断司机Agent是否是个好司机，有三个关键标准：专业能力、职业能力和构建信任的能力。VLA司机大模型提升了专业能力，超级对齐增强了职业能力，VLA通过理解自然语言、具备记忆能力提升了构建信任的能力。