没有什么能够阻挡,地平线对量产的向往

北京,西北五环外,中关村集成电路设计园。

这里是我这样一个普通「朝阳群众」平时很少触达的地方。

一是空间距离,身处北京东南侧的我需要跑完半圈五环,再加上一截高速,一共 40 多公里,才能到达这里,来一趟着实也不容易。

二是心理距离,「中关村」、「集成电路」、「芯片设计」这样的关键词给我的第一反应是高端、学术、硬核,第二反应是枯燥、乏味、难理解,因此总会抱着一种所谓的敬畏之心。

但这次,我们废了那么一点小劲儿,跨越空间和心理距离,自然是因为一些有趣的事情。

没有什么能够阻挡,地平线对量产的向往

我们要探访一家「点歪了技能树」的国产智能芯片公司,地平线。

搬家、教辅、地下工作

地平线在去年 7 月正式发布了单芯片 128 TOPS 算力的「征程 5」,此后还立下了「2022 Q4 交付」的 Flag。

没有什么能够阻挡,地平线对量产的向往

受疫情的不可控客观因素影响,原本我以为,地平线的这个 Flag 九成九是要延期了吧?答案是,不。

地平线联合创始人 &CTO 黄畅博士表示,基于征程 5 芯片的首发量产车型将在今年第四季度实现 SOP。

而「如期推进」的背后,则是一堆「点歪了的技能树」。

技能一:没「精通搬家」的创业团队不是一家好芯片公司。

这可能是全中国学历最高的专业搬家团队之一。

为了保障项目的如期进行,在上海疫情封控前,地平线上海团队组织了一波「紧急战略转移」,把相关芯片、设备以及各种能移动的开发工具统统搬到像苏州、杭州等邻近的城市,以避免开发资源被困住。同样,前段时间北京疫情反复,地平线接到了办公楼可能封控的消息,又在周末展开了新一轮的搬家工作。

没有什么能够阻挡,地平线对量产的向往

技能二:没「掌握教辅」的开发者不是一个好工程师。

谁能想到教辅行业也会出现「最美逆行者」。

上海疫情期间,地平线的工厂也实行了闭环管理。地平线的生产工作,有些工作是需要工程师去到产线上进行操作。但闭环管理之下,工程师显然是进不去,于是,各位工程师又加入了「夕阳教辅行业」——通过远程视频等方式,手把手教一线工人进行相关操作,以维护项目生产进度。

没有什么能够阻挡,地平线对量产的向往

技能三:不「深入地下」的钻研者不是好程序员。

你没看错,2022 年的地平线公司里居然出现了一群「地下工作者」。

准确地说,是「地下车库工作者」。北京疫情期间,地平线有个开发团队为了避免疫情影响,坚持在公司地库里工作了一个多月。地库气闷、潮湿、不见天日的环境,这群「勇士」多少让我感受到了一些革命先辈的宝贵精神。

没有什么能够阻挡,地平线对量产的向往

以上这些形容,当然都是大家苦中作乐的自我嘲讽和玩笑话。但玩笑的背后必然有员工对于自家产品的信念,这也让我更加好奇,征程 5 是一款怎样的芯片。

算力?效率?

征程 5 芯片的最大 AI 算力为 128 TOPS,作为国内为数不多的大算力自动驾驶芯片玩家,地平线的目光并不在国内,他们瞄准的是英伟达。

英伟达 Orin-X 的算力为 254 TOPS,客观地讲,仅看算力绝对值的话,Orin-X 毫无疑问是要强于征程 5 的。但有意思的是,地平线觉得征程 5 的效率更高。他们给出了一组数据,在同等精度下,针对高效模型,征程 5 的性能为 Orin-X 的 268%,能效为 Orin-X 的 870%。

没有什么能够阻挡,地平线对量产的向往

当然,需要说明的是,因为目前地平线仍然还获取不到 Orin-X 的硬件平台,他们也承认这组数据其实是来源于对英伟达上一代自动驾驶芯片 Xavier 的间接推算。

作为媒体以及普通消费者,对于产品之间的军备竞赛是我们最乐意看到的事情。倒不是说真实消费者会盯着性能参数谁高谁低这件事儿,毕竟最后辅助驾驶实战效果好才是真的香。相比寡头独霸,我们更乐于见到有更多玩家参与的良性市场竞争。

至于「绝对算力」和「真实效能」哪个才是王者,在产品落地前不可预知,但地平线给我们提供了一套非常严密的产品逻辑。

在征程 5 的产品理念中,效率是权重第一的性能指标。

没有什么能够阻挡,地平线对量产的向往

黄畅在三四年前就提出了下面这个 AI 效能公式:

「FPS/Watt &FPS/ $ 」=「TOPS/Watt &TOPS/ $」×「Utilization」×「FPS/TOPS」

没有什么能够阻挡,地平线对量产的向往

等式的左边代表的是 AI 芯片的真实效能。

其中 FPS 代表的是 AI 芯片每秒处理的帧数,可以看做是 AI 芯片最终的处理效率;Watt 代表的是 AI 芯片的功耗;$ 代表的是 AI 芯片的硬件成本。

因此公式左侧表示的,是我们为了实现相应 FPS AI 处理的效能,所需付出的能量功耗以及硬件成本,即真实效能。

等式右边则由三部分组成,「TOPS/Watt &TOPS/ $」指的是硬件架构设计,「FPS/TOPS」指的是算法架构设计,「Utilization」指的是软件架构设计。

真实效能公式详解

先来说硬件架构设计

TOPS/Watt &TOPS/ $ 指的是每 TOPS 算力所需的功耗以及成本,它依赖于硬件工艺、制程的不断演进。从 28nm、16nm、7nm 到 5nm,半导体工艺的不断演进都可以提升这项数值,这也是大多数硬件公司会做的。

没有什么能够阻挡,地平线对量产的向往

通常行业里都在讲,要做「软硬解耦」,即降低软件应用开发和硬件设计之间的联系。这是为了降低芯片用户的开发难度,使得芯片用户关注自身的软件实现即可,更底层的硬件相关则交给芯片公司来搞定。

但黄畅说,地平线要做「软硬结合」。

这两者其实并不矛盾,因为它们所描述的其实是 AI 芯片的不同阶段。「软硬解耦」指的是芯片应用阶段,而「软硬结合」则指的是硬件设计阶段。

「从实际场景出发,软件定义芯片。」

没有什么能够阻挡,地平线对量产的向往

这是地平线硬件的设计理念,也就是所谓的「从软件中来,到软件中去」。毕竟,AI 芯片的设计目的是为了更好地承载软件需求,而 AI 芯片的存在意义是为了发挥软件功能。

具体到实现方式,地平线在芯片硬件设计阶段就考虑了片上存储阵列、张量计算组织、指令集设计等因素,以结合软件最大化地提高硬件利用率。

没有什么能够阻挡,地平线对量产的向往

这也是地平线的硬件芯片属性所具备的特点。

其次是算法架构设计

可能很多人听过硬件的摩尔定律——每 18 个月,半导体晶体管密度会增加一倍。但应该也很多人都听说过,受限于硅材料的物理极限,摩尔定律其实早就失效了。

但算法摩尔定律可没有失效。算法摩尔定律指的是算法解决一个 AI 任务达到精度要求的计算次数会随着算法的演进持续下降。

根据之前美国 OpenAI 公司发布的行业调研显示,大约 9-14 个月,完成同一个 AI 任务所需的有效计算复杂度会下降一半。

没有什么能够阻挡,地平线对量产的向往

对比硬件提升的速度,算法的提升速度要快得多。

对此,黄畅说,「地平线的逻辑是解决主要矛盾。」

在黄畅看来,硬件上的差异各家不会很大,但在算法上,由于演进速度快,各家就会产生巨大的差异,因此算法就会变成现阶段的核心竞争力。这可能也是地平线提出「新一代汽车智能芯片领导者,必须也是世界级 AI 算法公司」的一大原因吧。

最后则是软件架构设计

对于一款已经定型的 AI 芯片来说,在硬件架构和算法架构保持不变的前提下,软件架构的持续改善依然能提升 AI 芯片的真实效能。

这里说的软件,其实也是偏向底层的编译器优化。

同一个算法在同一款芯片上,编译、拆解、重组、部署等方式的不同,对于硬件调度的有效性也会发生改变。

以上这些就是软件架构存在的意义,也是软件架构需要持续演进的目的。

老实说,对于我们外行人来说,因为不明所以,所谓的软件架构、编译等名词听着就特别虚。但黄畅提出了一个量化数据。征程 5 芯片在发布时,地平线给出的最强计算性能是 1283 FPS,但现在,这个数字已经变成了 1531 FPS。

在芯片硬件架构、算法架构都固定的状态下,只靠软件架构的优化,征程 5 芯片的最强计算性能提升了 20%。

没有什么能够阻挡,地平线对量产的向往

「能让软件做的事情就让软件做,硬件尽量做简单、高效、且被软件调用的功能。」

这是黄畅口中,地平线对于自动驾驶芯片的软硬件理解,这些也是地平线作为一家把硬件架构设计、软件架构设计、算法架构设计都抓在手里的 AI 芯片公司,对比国内同行所具备的优势。

没有什么能够阻挡,地平线对量产的向往

而这一下午的沟通会明显也把黄畅聊嗨了。这头征程 5 还在紧锣密鼓准备量产,那头,下一代征程 6 也在路上了,这次,新的核心计算架构 BPU 代号是「纳什」。

一代 BPU 代号「高斯」,二代 BPU 代号「伯努利」,三代 BPU 代号「贝叶斯」……

地平线喜欢用数学家的名字来命名他们的核心计算架构。

这种喜好宛如他们点歪的技能树,大概就是耿直理工男心中的那份浪漫吧。

原创文章,作者:超级充电站,如若转载,请注明出处:https://www.cydao.com/8536.html

(0)
超级充电站超级充电站
上一篇 2022年7月2日 10:04
下一篇 2022年7月2日 20:16

相关推荐

分享本页
返回顶部