大模型重塑汽车智能上限，车企如何把握大模型风口？

　　前不久，文生视频大模型Sora再次引发行业地震。根据简单的文本指令，Sora就能生成一段包含丰富真实细节的60秒视频，并且能够保持高度的流畅性与稳定性，让外界为之惊叹的同时，也让汽车行业看到了自动驾驶应用的新方向。

　　Sora生成的视频画面

　　现阶段各家主推的端到端自动驾驶技术框架，其训练核心就是视频生成，打造一个真实世界的模拟器。在Sora发布不久，特斯拉创始人埃隆·马斯克在社交媒体上“不服气”地表示：“特斯拉有全球好的真实世界视频生成能力！”马斯克透露，特斯拉在大约一年前就能生成真实视频，只不过由于训练数据来自汽车，生成的视频并不像Sora那样丰富有趣。毫无疑问，Sora大模型的出现，标志着AI对物理世界的理解和模拟能力进一步加强，将掀起新一波自动驾驶+大模型技术演进的内卷。

　　埃隆.马斯克在X上的推文

　　实际上，汽车作为AIoT的关键场景，大模型对于汽车行业的影响不仅在于促进自动驾驶的发展，还将重塑汽车人机交互方式，刷新汽车产业链生产、营销、管理的效率。

　　智能座舱+大模型：一个快速达成的共识

　　不可否认，ChatGPT确实让汽车行业关注到了大模型技术的关键入口——智能座舱。

　　理想、小鹏、吉利、蔚来、吉利等车企分别表达了对大模型的期待，同年3月初，在理想汽车春季媒体分享会上，李想系统地谈到了大模型发展背后的逻辑和思考，并于6月发布了自研认知大模型「Mind GPT」；3月中旬的小鹏汽车2022年Q4及全年财报电话会议上，何小鹏也谈到了ChatGPT，并在随后宣布自研XGPT灵犀大模型准备接入语音系统。

　　理想发布认知大模型「Mind GPT」

　　除此之外，吉利全场景AI大模型、蔚来NIOGPT、奇瑞与科大讯飞合作研发的星火认知大模型等纷纷亮相，此外，科技公司如百度文心一言大模型、腾讯混元大模型、华为的盘古大模型等也纷纷提出“上车”规划。腾讯智慧出行副总裁钟学丹表示：“座舱大模型的应用，将座舱交互形态从单一的任务方式逐步转变成基于多任务的应用场景，从现有的单一语音交互向多模态的交互方式转变。此前我们在座舱里面输出更多是内容消费和服务，结合大模型，我们会在内容的生产、跨平台分享等层面提供新的功能。”基于语音交互的大模型与智能座舱天然的融合能力，正在以惊人的速度在业内达成共识。

　　大模型推动自动驾驶“奇点”来临

　　作为智能汽车发展的另一个重要支点，智能驾驶也在大模型技术加持下迎来关键突破点。

　　众所周知，类似GPT这样的大模型，其底层技术支撑来自Transformer算法，在2018年特斯拉AI Day上，特斯拉将Transformer引入到自动驾驶算法架构之中，自此，BEV+Transformer成为自动驾驶领域走向量产的新思路，增加自动驾驶系统处理能力的通用性和泛化性，使智能驾驶学会总结归纳而不是机械式学习。可以说，自动驾驶天生就是大模型应用场景的「应许之地」。

　　大模型为自动驾驶带来的环境判断能力

　　然而，智驾大模型由于受到车端算力的限制，需要部署车、边、云一体化的算力协同。利用云端算力优势训练大规模多模态数据，然后再结合边端的计算能力，通过多任务的学习和分布式训练为车辆提供更有效的感知融合效果与实时建图方案，最终让车端实现与人类司机一致的感知、预测、规划等能力。因此，随着大模型的应用，算力成为自驾竞争“入场券”。

　　全链覆盖，全面惠及汽车从研发到售后的全部环节。

　　行业大模型最终目的不是炫技，而是最终对产业形成切实的帮助，让大模型回到业务本质，在汽车研发设计、营销客服等各个环节发挥应用价值。

　　腾讯集团高级执