对于以 ChatGPT 领头的大语言模型 AI 们，早就火热到不需要解释来龙去脉。它们已经火热到连我姥姥都在问这玩意会不会让我失业的程度。

而这几天，OpenAI 也是再度投下重磅炸弹，迭代效率超出外界预期的 GPT-4，展现出了远比本就让不少人激动的 GPT-3.5 更加优越的性能。

GPT-4 直接把语言理解的能力拉爆——它的中文普通话得分比 GPT-3.5 的英文「母语」分数还要高，之前让人有些啼笑皆非的数学逻辑处理，现在能去国际大赛拿走一箩筐奖杯。

甚至连英伟达的人工智能科学家 Jim Fan 博士看完成绩单之后都大呼，GRE 语文成绩比他还高的 GPT-4，指不定也能去斯坦福读个博。

于是，我们见证了最近一段时间 AI 改变世界的应用盛景。

作为 OpenAI 大股东，微软当仁不让实现了第一个摘桃，只见纳德拉站上舞台振臂一挥，坦白那个比去年的 ChatGPT 更聪明还有自己小情绪的 New Bing，其实就是用的 GPT-4。

还没完，Office 即日起多了个「Copilot」，对话框给出要求和材料，立马生成精致详细的文档表格，甚至是一键输出找金主要小钱钱的 PPT，工作效率直接翻番。

眼睛不大但思路特广的常岩老师，找超级充电站车评做得贼溜的程序员咩总一合计，打算给 GPT-4 狂喂媒体每天发布的新鲜内容，做一个问啥都懂要啥都灵的汽车百科全书。

好家伙，这么先进的生产力工具普及了，果然连我们自己都要卷。

这些年车企一个两个都不想在科技属性上落后，最近也是喊着要把类 GPT 能力装上车，有冰箱空调大沙发还不够，得让车主们好好感受一下，什么叫人工智能震撼。

只是，看起来能文能武的大语言模型，究竟能给汽车带去多少改变？

只做超级加强版小爱，就是大材小用

作为车圈的智能旗手，特斯拉用户们在 AI 应用上当仁不让。

苦语音助手久矣的他们，就率先把 ChatGPT 搬上了。

借着 OpenAI 的开放接口，他们给 iPhone 设置好通过快捷指令调用 GPT 模型的办法，再加上之前就有的通过网页连接 CarPlay 的措施，终于实现了层层接力在车机上使用语音助手的可能。

话说回来，这也不是特斯拉的专利，只要车机支持使用 CarPlay，大家都能一视同仁地进入 AI 时代，甚至别的牌子还会更轻松一些。

这可能是最接近实现的大语言模型上车应用场景，给你找来了一个能说会道通晓哲理还掌握不止八国语言的副驾，相比之下开关冷暖空调调整车机就都是小 case 了。

单就 GPT-4 的水准，拿去给车载语音助手来个史诗级进化，像真的副驾一样做到听懂指令指哪打哪，绝对不在话下。而且还任劳任怨，不会一不开心就搞一出非暴力不合作的好戏。

最近有不少表示要接入百度的大语言模型文心一言的车企，指不定就是走的这条路，当然能给这个「外部势力」开放多少座舱权限，就因车而异了……

仔细想想，这不就是给座舱装了个超级加强版小爱同学吗？明明识别和理解都接近人类，可做的事情还是老一套。

大语言模型 AI 有更强的自然语言理解能力，必定彻底改变车载语音助手，但要仅限于此未免大材小用。

既然它能充当副驾角色，那为什么不干脆能力拉满，做到驾校教练那般保障行驶安全甚至超越呢？

能听会看懂开车，全能副驾要来了？

如果说 GPT-3.5 一面世，做语音处理的研发人员高呼快要失业的话，那 GPT-4 发布后，在图像识别上琢磨好些年的老哥们都得默默开始准备起简历了。

没错，GPT-4 理解图像也是一把好手。官方演示里直接问鼎最强 OCR，文字和公式转录都是小意思，晦涩到只有小众群体才能理解的图片笑话，也能一板一眼解释笑点在哪。

还没完，在纸上画出的潦草产品原型，拍照输入到 GPT-4，立马获得完整代码，能直接生成页面上线的那种。我司的程序员咩总，搞不好已经在琢磨车评也被 AI 包圆之后的职业规划了……

甚至有用 AI 造车的。美国电动车配件周边品牌 Jowua 用 AI 生成了一辆车的设计，需求是有特斯拉的风格，但也有大众的设计感，并要求 AI 给出 Logo 和对应的宣传策略。

AI 最终给出的设计有模有样——这辆车的名字叫 Jowua Renda，标称 960 公里续航，仅 10 分钟就能充电至 80%，售价只需 5 万美元。预计在 2032 年 3 月 31 日，美国东部标准时间下午 1 点发布。

常岩老师看了两眼直放光：「我二次创业去印度造智能老头乐的设计费看来可以省了」。

GPT-4 表现出如此强大的多模态理解能力，是不是意味着如果将大语言模型用于自动驾驶，就有可能让车辆像人类那样，能对突然出现的未知场景做出合理判断？

在 GPT-4 相关讨论问答下，知乎网友「Trinkle」给出如此看法：「zero-shot image understanding（零样本图像理解）已经不是梦了，也就意味着 L4 自动驾驶技术已经出来了。」

不过高效感知-理解-决策只是实现高阶自动驾驶的一部分条件，做到基于逻辑推理而非数据标注的自动驾驶后，我们还有更多复杂问题需要解决。

就如知乎网友「大威天龙」的点评：「这个技术可以大幅度提高单目摄像头识别的效率（但不提高准确性）。而 L4 还是安全问题，而不是功能问题。」

我还看好大语言模型在驾乘体验发挥作用，语言 + 图像多模态感知，其实可以成为人、驾驶域 AI 之外的第三个车上大脑，创造更主动的座舱智能。

人从身体变化再到感知理解和作出反应，会比环境情况实际时间点慢上不少，许多人都是后背屁股闷到不行快出汗了，才会打开座椅通风。

结合语言、图像和其他车内感应器感知，AI 很适合来完成座舱体验主动调整，掌握变化的时效性高过人类，又能以符合人类需求的方式改变各类设置。

现已有车型提供自适应座舱，可预先训练的模型和人类手写的规则，覆盖场景不会比随机应变的大语言模型更全面，更不用说把每个驾乘者喜好都细致记录，如此之类的深度服务需求。

增强人车共驾能力，和实现座舱与驾驶跨域协同，看起来是有机会实现的发挥大语言模型能力的场景。

常岩老师就有过眼球位置没能被正确识别，给驾驶员注意力系统误以为开车睡着的经历。要是结合前后图像以及车内其他传感器数据，接入 GPT-4 这般强大的推理能力，或许不会再有尴尬了。

就算是驾驶员真的太过疲惫睡着，大语言模型完全可以发挥自己副驾的职责，在驾驶员完全清醒之前做出合理决策，杜绝误操作发生危险的可能。

依稀记得《高智能方程式》里的超级 AI「阿斯拉达」，平时跟主角插科打诨扮演男二号，关键时刻做军师教人赛车，什么都会还什么都不含糊。

没想到动画播出近 30 年后，也是故事发生的近 10 年后，「阿斯拉达」就要来到现实中了。

别问到底能干嘛，先把大饼给画好

我很想找到一个现在就已经把大语言模型装上车的案例，不过暂时还没有任何一家车企实现。

可以相信，随着 GPT-4 问世，以及 OpenAI 努力降低调用成本，必然会有车企完成大语言模型在汽车的应用落地。

实际上，百度的文心一言可能是最先上车的大语言模型，百度「亲儿子」集度之外，吉利、长城、爱驰、红旗、长安、岚图、零跑、东风日产、海马等车企纷纷宣布要接入，主打一个也不能少。

也别担心调用 AI 需要联网等服务器反馈，适用于车载有限算力的大语言模型正在路上，没信号同样能智商在线。清华大学唐杰团队新发布的 ChatGLM，就可以在消费级显卡完成部署（最低只需 6GB 显存）。

至于大语言模型上了车究竟能干嘛，车企们暂时还没解释太多，都只说会在交互上有创新。但这足够让我们期待，更何况还有数个中国本土研发成果蓄势待发。

大语言模型 AI 上车时间表

2023 年 2 月 14 日，集度在「ROBOVERSE 三里屯体验中心启动会」上宣布，集度汽车机器人将融合百度文心一言的全面能力。

2 月 17 日，红旗汽车宣布成为文心一言首批生态合作伙伴，将在汽车生态领域全面接入文心一言能力。

2 月 20 日，吉利汽车宣布正式加入百度文心一言生态圈，吉利银河智能座舱将应用智能对话技术成果。

2 月 27 日，长安宣布正式成为百度文心一言首批先行体验官，携手打造基于智能汽车场景的大模型人工智能交互。

3 月 16 日，岚图汽车宣布将通过 Apollo-智能驾驶融合文心一言的全面能力，岚图智能座舱首发搭载文心一言。

28 年前，中国第一家互联网公司瀛海威在中关村竖起广告牌：「中国人离信息高速公路有多远——向北 1500 米。」28 年后，瀛海威早已作古，激化的互联网浪潮却驱动着全社会发生巨变。

关于大语言模型 AI、ChatGPT 还有文心一言，能否在 AI 技术路线上笑到最后，现在没有答案。但可以明确，这轮又一次改变人类的浪潮中，它们已成为通向远方的路标。

包括智能出行在内，AI 还会带来多少变革？我们将在不太遥远的未来见证这一切的到来。

原创文章，作者：白徵明，如若转载，请注明出处：https://www.cydao.com/13898.html

一窝蜂上车的超级 AI，到底能给我们带来什么?

只做超级加强版小爱，就是大材小用

能听会看懂开车，全能副驾要来了？

别问到底能干嘛，先把大饼给画好

大语言模型 AI 上车时间表

相关推荐