当前位置:首页 > 科技  > 资讯

称赞特斯拉基本功扎实,李想再谈AI:人工智能时代,基本功不可跳跃

来源: 责编: 时间:2025-05-08 17:50:48 105观看
导读 距离理想汽车CEO李想上一次谈AI已经过去了130多天,在5月7日晚的《理想AI Talk第二季》中,李想分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战。在这130多

APW28资讯网——每日最新资讯28at.com

距离理想汽车CEO李想上一次谈AI已经过去了130多天,在5月7日晚的《理想AI Talk第二季》中,李想分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战。APW28资讯网——每日最新资讯28at.com

在这130多天时间里,外部世界发生了巨大的变化。DeepSeek横空出世,在全球掀起AI热潮,致力于要做AI公司的理想汽车置身其中,“拥抱DeepSeek的这个过程比我们想象得要快。”李想称。据介绍,得益于DeepSeek的开源,理想汽车在VLA司机大模型的语言能力研发上提速显著,节省了近9个月的时间和数亿元成本。APW28资讯网——每日最新资讯28at.com

也正因如此,理想汽车今年3月27日宣布把自研的整车操作系统理想星环OS开源。“我自己内心,包括谢炎(理想汽车CTO)的内心就是DeepSeek给我们带来那么大的帮助,我们应该给社会贡献点什么。不让行业那么卷。说白了纯粹是感谢DeepSeek。”APW28资讯网——每日最新资讯28at.com

而在这130多天的时间里,李想本人依然是舆论场中颇具话题性的代表人物。就在《理想AI Talk第二季》上线的同一天,“李想年薪6.39亿元”的话题冲上微博热搜。对此,理想汽车方面回应时代财经称,事实上,李想2024年全部实际薪酬为266万元。目前披露的6.39亿,属于公司按照美股上市公司(美国会计准则)对于期权的特殊记会计费用方式,不是李想的实际薪资收益。APW28资讯网——每日最新资讯28at.com

李想也谈到近期的“智驾”争议,今天的辅助驾驶走到了一个新的十字路口上,对此,他回应称:“经过多年,从规则算法到端到端+VLM(视觉语言),再到现在真正迈入VLA(视觉语言行动模型)的阶段,现在比较像‘黎明前的黑暗’。”APW28资讯网——每日最新资讯28at.com

图片来源:理想汽车 APW28资讯网——每日最新资讯28at.com

“AI成为生产工具才能真正爆发”APW28资讯网——每日最新资讯28at.com

为什么人类一定需要辅助驾驶?为什么科技不能就此止步?APW28资讯网——每日最新资讯28at.com

抛出这两个问题后,李想的回答是:只要人类会雇佣司机。我觉得人工智能技术其实就是把类似这样的一些功能和角色去变成真正的生产力、生产工具,然后去进行替代。APW28资讯网——每日最新资讯28at.com

李想表示:“判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具。只有当人工智能变成生产工具,才是其真正爆发的时刻。”APW28资讯网——每日最新资讯28at.com

而VLA能够让AI真正成为司机,成为交通领域的专业生产工具。“对于理想汽车而言,VLA是一个司机大模型,像人类的司机一样去工作的一个模型。”李想说。APW28资讯网——每日最新资讯28at.com

创业做AI是“造人”,而理想汽车做的就是在“造司机”。APW28资讯网——每日最新资讯28at.com

VLA 最早由DeepMind于2023年提出并应用在机器人领域。根据财通证券研报,VLA不仅融合了VLM(视觉语言模型)的感知能力和端到端模型(E2E)的决策能力,更引入了“思维链”技术,实现了全局上下文理解与类人推理能力。APW28资讯网——每日最新资讯28at.com

2024年,理想汽车正式推送了端到端+VLM(视觉语言模型)辅助驾驶。不过,端到端模型在处理复杂问题时存在局限,虽可借助VLM视觉语言模型辅助,但VLM使用开源模型,使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。APW28资讯网——每日最新资讯28at.com

2024年,理想汽车开始了VLA研究。VLA的训练分为预训练、后训练和强化训练三个环节,类似于人类学习驾驶技能的过程。APW28资讯网——每日最新资讯28at.com

在理想汽车进行VLA研究的这一时期,横空出世的DeepSeek全球爆火。根据公开资料,2024年12月,视觉模型DeepSeek-VL2、模型DeepSeek-V3首个版本相继发布并同步开源。2025年1月15日,DeepSeek官方App正式上线。APW28资讯网——每日最新资讯28at.com

彼时,李想问团队:“DeepSeek开源开得如此彻底,我们是否应该基于它的开源,去做我们的VLA的L(language 语言)的部分,我们是否应该站在巨人的肩膀上去做?”理想汽车CTO谢炎说:“肯定应该这么做。”理想汽车基座模型负责人陈伟则更为坚决,陈伟认为,理想应该以这个为基础,加速VLA,加速端到端的多模态的进展。APW28资讯网——每日最新资讯28at.com

“拥抱DeepSeek的这个过程比我们想象得要快。”李想称,我觉得DeepSeek的出现对我们加速做VLA是巨大的帮助。过去我们计划要到今年年底才能做出一个像样的、能够满足我们需求的语言模型,但DeepSeek一开源,我们就加速了9个月的时间,所以给我们带来了巨大的收益和帮助。” APW28资讯网——每日最新资讯28at.com

图片来源:理想汽车 APW28资讯网——每日最新资讯28at.com

据悉,VLA司机大模型以“司机Agent(智能体)”的产品形态呈现,用户可通过自然语言与司机Agent沟通,跟人类司机怎么说,就跟司机Agent怎么说。简单通用的短指令由端侧的VLA直接处理,复杂指令则先由云端的VL基座模型解析,再交由VLA处理。APW28资讯网——每日最新资讯28at.com

“VLA是现阶段效率最高的架构”APW28资讯网——每日最新资讯28at.com

不仅是理想汽车,元戎启行、Waymo、Wayve等企业也在VLA领域进行布局。APW28资讯网——每日最新资讯28at.com

高盛最新自动驾驶报告显示,到2030年,VLA模型主导的端到端方案可能占据L4级市场60%份额。APW28资讯网——每日最新资讯28at.com

财通证券表示:“现阶段,智驾市场竞争焦点已从单纯的功能实现转向了更深层次的技术范式竞争,强调技术架构的先进性和可持续性。”APW28资讯网——每日最新资讯28at.com

当前智能辅助驾驶行业的技术路径快速迭代。从依赖规则算法和高精地图的辅助驾驶到端到端+VLM辅助驾驶,再到VLA。在李想看来,未来是否有效率更高的架构出现,需要打个问号。“我认为大概率还是会有的。但VLA是现阶段效率最高的架构。”APW28资讯网——每日最新资讯28at.com

与此同时,行业也存有共识,VLA 模型的上车难度不小,对技术和车端的芯片算力都有高强度要求。APW28资讯网——每日最新资讯28at.com

APW28资讯网——每日最新资讯28at.com

“其他车企也可以做,但其有没有建立整个基座模型的能力,以及预训练、后训练、强化训练的能力,(带来的结果)是不一样的。很多时候一家公司如果模型能力不强,根本不知道怎么去做对齐。”李想称。“包括今天很多企业做端到端都很吃力,因为在规则算法时候都没做好。”APW28资讯网——每日最新资讯28at.com

在他看来,大型企业的基本功和能力永远无法被逾越。APW28资讯网——每日最新资讯28at.com

李想以特斯拉为例,“从实测上看,目前特斯拉在中国市场的辅助驾驶版本大概在用12.5之前的模型,其采用的是半规则算法能力,这并不是特斯拉真实能力,距其真实能力还有巨大差距,特斯拉13.0以后的能力还是非常强的,能看到特斯拉基本功是非常扎实的。”APW28资讯网——每日最新资讯28at.com

李想称:“我觉得这个是我们真正要去学的。尤其在今天这种内卷、外部不确定的环境下,更是每个企业扎扎实实练基本功的最好的时候。而且到了人工智能时代,基本功就更是不可跳跃的。如果很多企业做了很多创新,但是没有基本功,不扎实,所以很多创新就会昙花一现过去了。”APW28资讯网——每日最新资讯28at.com

伴随技术架构的不停进阶与其真正落地应用的不断深入,可以看到,今天行业的辅助驾驶走到全新的十字路口。APW28资讯网——每日最新资讯28at.com

李想认为,“经过多年,从规则算法到端到端+VLM,再到现在真正迈入VLA的阶段,现在比较像‘黎明前的黑暗’。我觉得黎明马上就要来了。但是会先经历一个黑暗的过程,之所以有黑暗是因为要迎来黎明。”李想说。“我觉得今天这个阶段。正因为辅助驾驶行业遇到了问题。我最喜欢、最开心的方式,就是去解决行业解决不了的问题,我觉得这是我们自己坚决相信的。”APW28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-148573-0.html称赞特斯拉基本功扎实,李想再谈AI:人工智能时代,基本功不可跳跃

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 比尔·盖茨被女儿曝出患有阿斯伯格综合征,社交行为曾让女婿害怕

下一篇: 资本争着喝奶茶?沪上阿姨上市首日股价冲高至172.8港元,70后创始人赢麻了

标签:
  • 热门焦点
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 分享六款相见恨晚的PPT模版网站, 祝你做出精美的PPT!

    1、OfficePLUSOfficePLUS网站旨在为全球Office用户提供丰富的高品质原创PPT模板、实用文档、数据图表及个性化定制服务。优点:OfficePLUS是微软官方网站,囊括PPT模板、Word模
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • 超闭合精工铰链 彻底消灭缝隙 三星Galaxy Z Flip5与Galaxy Z Fold5发布

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。三星新一代折叠屏手机采用超闭合精工铰链,让折叠后的缝隙不再可见。同时,配合处
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 2022爆款:ROG魔霸6 冰川散热系统持续护航

    喜逢开学季,各大商家开始推出自己的新产品,进行打折促销活动。对于忠实的端游爱好者来说,能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的
Top