李想再谈VLA司机大模型:终极是像人类司机一样工作
2025/05/08 | 作者 曹杨 | 编辑 郝琳
摘要:5月8日,理想L系列智能焕新版车型正式发布,包含L7、L8、L9三款车型,以及此前在上海车展发布的L6智能焕新版。
2025年5月8日,理想L系列智能焕新版车型正式发布,包含L7、L8、L9三款车型,以及此前在上海车展发布的L6智能焕新版。其中,理想L6智能焕新版售价24.98万-27.98万元,理想L7智能焕新版售价30.18万-35.98万元,理想L8智能焕新版售价32.18万-37.98万元,理想L9智能焕新版售价40.98万-43.98万元。
此次智能焕新版车型主要围绕外观造型、底盘、辅助驾驶、智能座舱等软硬件功能进行升级。
图/理想汽车官方
外观方面,理想L6智能焕新版新增天青色外观颜色,理想L7和L8智能焕新版新增蓝灰外观颜色,理想L9智能焕新版新增雅灰外观颜色。
底盘升级方面,理想L7和L8智能焕新版全系搭载双腔魔毯空气悬架;理想L9智能焕新版搭载行业前沿的双腔双阀魔毯空气悬架,成为首款搭载双腔空气弹簧+双阀减震器的中国品牌SUV。
相较于外观和底盘的升级,辅助驾驶方面的升级是这次发布会的重中之重。
L系列智能焕新版全系迎来辅助驾驶芯片升级,AD Max升级NVIDIA最新Thor-U芯片,是全球首个大规模量产交付NVIDIA Thor-U芯片的高级辅助驾驶平台;AD Pro升级新一代地平线征程®6M芯片。
此外,理想方面提到,今年下半年,理想汽车高级辅助驾驶将升级为新一代VLA(Vision-Language-Action Model,视觉语言行动模型)司机大模型。
在产品发布会前一天,理想举办了“理想AI Talk”第二季的直播,这次直播距离上一次“理想AI Talk”已经过去了130天。
在这长达4个多月的时间里,整个AI产业都发生了翻天覆地的变化,DeepSeek横空出世,搅动了全球人工智能的发展,理想也成为了受益者之一。
“DeepSeek的出现对加速VLA(视觉语言行动模型)是巨大的帮助。理想原本计划于2025年9月完成的VLA语言模型部分,因直接采用DeepSeek的开源框架,研发进度提前了9个月。”理想汽车董事长兼CEO李想在“理想AI Talk”第二季上说道。
VLA架构被李想看成是辅助驾驶发展的必然结果,但在谈到“VLA司机大模型的作用、训练方法和挑战”时,李想直言,VLA的实现不是突变的过程,而是进化的过程,经历了三个阶段,对应理想汽车辅助驾驶的昨天、今天和明天。
图/理想汽车官方
第一阶段,理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”。
第二阶段,理想汽车自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,视觉语言模型)辅助驾驶,接近“哺乳动物智能”。
端到端模型在处理复杂问题时存在局限,虽可借助VLM视觉语言模型辅助,但VLM使用开源模型,使其在交通领域的能力有限。
在端到端的基础上,到第三阶段,VLA将开启“人类智能”的阶段。对于李想这段话更直接的理解,就是“未来的VLA就是一个像人类司机一样工作的司机大模型”。
就像人类想要成为一个技术高超的老司机,需要积累丰富的驾驶经验一样,VLA想要成为“VLA司机大模型”,也要经过VL(视觉语音)基座预训练、辅助驾驶后训练、辅助驾驶强化学习和司机Agent(智能体)四个阶段的训练和推理过程,从而让用户可通过自然语言与司机Agent沟通,实现“跟人类司机怎么说,就跟司机Agent怎么说”。
除了提升专业能力,VLA司机大模型更需要解决安全性和模型黑盒的问题,从而保障VLA司机大模型能够实现职业司机般的安全和舒适,避免学习加塞等违规行为。
李想表示,判断司机Agent是否是个好司机,有三个关键标准:专业能力、职业能力和构建信任的能力。VLA司机大模型提升了专业能力,超级对齐增强了职业能力,VLA通过理解自然语言、具备记忆能力提升了构建信任的能力。
ABOUT / 相关报道