文章主题:智能车, ChatGPT, 大模型, 端到端自动驾驶

666AI工具大全,助力做AI时代先行者!

智能车的「ChatGPT时刻」,还有多远?| 模力时代

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

要说今年“科技春晚”CES上最吸引眼球的是什么,智能车当属其一。

毕竟大模型一上车,智能座舱都卷成酱婶了:

让车上的数字助手帮忙记录约饭日程,Ta能直接帮你把餐厅也给预定了。

1705645638914.jpg

骁龙座舱平台效果展示

规划路线这种事儿也变得充满巧思,数字助手会根据你的习惯,主动问你:“路上买杯咖啡不?”

1705645640577.jpg

骁龙座舱平台效果展示

智能车上下游厂商纷纷秀出肌肉,也难怪不少前线参展的胖友们感叹:CES能当车展逛了。

5bbc382c30fd4153903c1a875245da8a.jpeg

实际上,随着大型模型在实际应用中的重点逐渐从云端转向终端,各种手机制造商纷纷跟进,开始在端侧部署大型模型。此外,大型模型在汽车领域的应用也逐渐受到广泛关注,成为当前的研究热点之一。

智能车是现今最重要的智能移动终端之一,而大模型被认为是AI规模化应用的关键。

特斯拉所引发的对于端到端自动驾驶方案的热议,其背后所隐藏的技术趋势,便是运用大模型将感知、预测、规划等多个模块进行串联。这一创新性的技术方式,不仅依赖于大模型的强大能力,同时也展示了生成式AI在智能座舱构建中的重要性。

2985f7e641b84fc288c33d7fcfea42f7.jpeg

在当前的“模力时代”,大模型重构 everything 的趋势下,从智能座舱到自动驾驶,“汽车机器人”的真正实现,正在全方位地围着大模型转。

那么,问题来了——

智能车真的需要大模型吗?

前文已经说到,大模型上车的两种最受关注的趋势,其一围绕自动驾驶,其二聚焦智能座舱。

自动驾驶方面,随着CVPR 2023最佳论文颁给自动驾驶大模型,一种行业共识浮出水面:

端到端自动驾驶是行业的未来,而新的突破将以大模型技术为基础。

7242b812bacc450b9d622e6a14f5de26.jpeg

CVPR 2023最佳论文

有别于传统上更多基于规则的自动驾驶算法,端到端模型能够直接基于传感器输入(如摄像头数据),学习如何控制输出,无需人为设计复杂的中间表示。

在端到端自动驾驶方案中,要使模型具备遵守交通规则的能力,诸如闯红灯等行为应被避免。实际上,我们无需为模型制定特定规则,只需充分利用大量高质量的交通信号灯视频进行训练即可。换言之,通过充分挖掘现有资源,而非仅仅依赖规则限制,我们可以实现模型的智能成长与进步。

这表明,端到端模型在处理复杂交通场景方面具有优势:相较于依靠手写规则的方法,这种模型能够根据实际场景进行推理,从而更好地解决因 corner case 导致的应用落地难题。

在《2023年度十大前沿科技趋势报告》中,量子位智库指出,端到端自动驾驶技术正逐渐展现出全部模块神经网络化的特点。这种技术对规则的依赖性较小,能够展现出智能涌现的能力,同时具备跨场景应用的巨大潜力。

f0debcb14dd64359ad7180e71bf0527e.jpeg

在CVPR 2023年度最佳论文《Planning-oriented Autonomous Driving》的研究中,作者们通过实验性地验证了骨干网络增大的效果,他们观察到这种增大的趋势可以提升感知分数,从而有可能进一步提高模型的预测和规划性能。这一发现对于自动驾驶领域的发展具有重要的理论和实践意义。

更大的神经网络模型具有更丰富和复杂的特征表征能力,这使得它们能够更好地应对自动驾驶场景中更为复杂数字数据处理和决策制定任务。

如果说大模型驱动的自动驾驶还是探索进行时,生成式AI与智能座舱的结合,则已经更快一步有了具体落地案例。

在今年的CES上就可见一斑。

比如吉利银河E8,就已大模型上车,实现了车上的影音娱乐和AI交互的个性化:基于文生图大模型,秒级生成私人定制款专属壁纸、精准推荐音乐还能基于音乐意境生成风格化壁纸、AI数字精灵具备“人设”更加拟人……

71b344b913094e63b9cf8566c79dbcc1.jpeg

高通的骁龙数字底盘概念车,更直观展现出了边缘侧生成式AI的高效用例。

比如仪表盘上出现了一个警示灯,不必研究用户手册,直接向数字助手提问就能立刻得到答案。AI甚至还能帮助你当场预约维修。

1705645641909.jpg

youtube@HotHardware

关键是,部署在车端的大模型,即终端侧AI的模式,在结合本地数据提供更加个性化的座舱服务的同时,能够保护用户数据“足不出车”。这既保障了用户的隐私安全,也缓解了云端处理带来的时延问题。

另外,对端侧算力的充分利用也能大大缓解用户规模化增长给云端算力带来的成本压力。

不难看出,对于自动驾驶领域而言,大模型的技术浪潮,带来了突破当前技术瓶颈的新路径。因此也不乏业内人士给出这样的判断:真正要在通用场景下实现L4、L5级自动驾驶,大模型不可或缺。

值得关注的是,尽管云侧基础大模型及其应用一年来进展飞速,但大模型上车,仍然存在不小的挑战。

其一,是数据问题。相比于互联网的海量数据,自动驾驶领域本身数据量要小得多,并且对于训练端到端模型而言,来自优秀人类驾驶员的高质量数据更为关键。

其二,是算力问题。无论是智能驾驶中的路况实时推理,还是智能座舱中的用户意图理解和功能调度,都对端侧算力有着更高的需求。

其三,还有安全性问题。这一方面涉及到端到端自动驾驶模型的可解释性,另一方面,是端云结合过程中,如何确保用户隐私数据不泄露的问题。

而从硬件的视角来看,这些问题,实际上都对车载芯片提出了更高的要求。

「模力时代」,智能车需要什么样的车芯?

如果说骁龙8155(第三代旗舰级骁龙座舱平台)在过去几年中已经成为座舱是否智能的事实衡量标准之一,那么,在CES“车展”上频频出现的另一个关键词,已经透露出“模力时代”智能车新的竞逐方向——

骁龙8295(第四代至尊级骁龙座舱平台)。

从国产造车新势力,到奔驰宝马,CES上亮相的最新量产车上,骁龙8295已经成为新的标配。

5e1df9a24d2e4b2d9e8a7b12f3b14af2.jpeg

搭载骁龙数字底盘解决方案的宝马i7

在大模型上车的最新趋势里,车芯最新的进化方向是什么样的,不妨就以骁龙8295为例,具体拆解来看。

骁龙8295采用5nm工艺制程打造。算力方面,其CPU算力达到230K DMIPS,是骁龙8155的8倍;GPU则可实现每秒2.9万亿次单精度浮点运算(2.9TFLOPS)或每秒5.8万次半精度浮点运算(5.8TFLOPS),相较于8155,整体性能提升2倍,3D渲染性能提升3倍,能同时带动车内11块屏幕,远超市面上其他车机芯片。

更关键的是,骁龙8295搭载双核NPU,AI算力从8155的4TOPS直接跃升至30TOPS。

1a30f556f77b41058e3f5522cdad9ca4.jpeg

这样的参数性能,放在车规级芯片上,可以说是一骑绝尘。而反映到功能上,大模型、多模态交互、离线语音,甚至是舱泊一体、驾舱一体,都有了实现的基础。

以搭载了骁龙8295的极越01为例,云端的语音识别算法模型直接放在车端,实时响应时间能从1.5秒缩短到700毫秒。

除了常规自主泊车,还能在车外语音控制车辆实现自主泊车。

1705645645117.jpg

车内,在骁龙8295的支持下,极越01能实现对不同说话人的识别,也就是支持多人同时语音功能。配合离线语音库,即使没有网络连接,也能实现全功能语音识别。

并且车内的智能交互,现在也不仅仅停留在语音层面,配合眼神、动作的多模态交互,现在也可以在车上实现。比如,想要打开车上的某一扇窗户,不用详细说明,只要一句“打开窗户”再配合视线,车上AI就能秒懂车主心意。

1705645649939.jpg

值得一提的是,骁龙8295作为可扩展自动驾驶SoC平台,拥有广泛的软件生态系统,包括视觉感知、泊车和驾驶员检测软件栈等等。

对于车企而言,这意味着在骁龙座舱平台的基础上整“花活”更加方便快捷。

而站在消费者的角度,座舱内智能化体验的升级,以上所述也仅仅是个开始。

终端侧AI是AI规模化关键

大模型带来的变革,核心是人机交互方式的变革。

而智能车作为被给予厚望的“智能空间”,自然而然成为这场重构一切的技术变革风暴中不容忽视的一环。

智能车的“ChatGPT时刻”具体何时会到来,还没有人能够准确地预判。但至少在软硬件准备上,以高通为代表的玩家,已经率先一步做好了迎接爆发的准备。

9af6efcac156427a93478fa1d776d2ab.jpeg

事实上,这种逐渐聚焦到终端的对新“ChatGPT时刻”的期待,在2024年开端的这场CES上,可以说是无处不在。智能车备受瞩目,但远非全部。

从爆火的AI掌机Rabbit R1,到AI PC,再到AR/VR和具身智能机器人,AI与终端的结合,几乎已经蔓延到CES会场的每一个角落。

“模力时代”新一阶段的变革走向,也在其中越发显现:大模型/生成式AI技术落地到端侧,是新一轮AI机遇爆发的关键。

对此,高通公司总裁兼CEO安蒙在CES主题演讲中谈到:

生成式AI的发展,正在从第一阶段走向第二阶段。当前,整个行业已经将生成式AI在处理器中落地,下一步将是使用场景和应用的开发。

归结原因,核心其实是,数据在哪里,AI推理就应该在哪里进行

一方面,云计算推理成本正随着大模型应用用户数量的增加和模型参数规模的增大而急剧增加,需要充分利用端侧算力来平衡成本。另一方面,只有当终端就能运行AI大模型用例时,个人数据才能在受到保护的前提下被充分运用,实现真正个性化的大模型应用。

总而言之,2024年一开年,“模力时代”终端变革的一角,已经进一步向大众揭开。

可以预见的是,变革的风暴不会就此停滞,更多的智能变化,或许就将在这一年中,通过智能终端,离你我的生活更进一步。

点这里?关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

返回搜狐,查看更多

责任编辑:

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *