如今,距离 2019 年特斯拉「自动驾驶日」已经过去了两年的时间。
在当年活动上,特斯拉 CEO 埃隆·马斯克对自动驾驶技术未来做出了无数美好的预测。其中最著名的,莫过于那句,在 2020 年中期,将有 100 万辆特斯拉自动驾驶车辆上路,人们驾车时甚至「可以在车上睡觉」。
一晃眼,两年多过去了,特斯拉完全重写的 FSD 系统依然在美国内测。在 8 月19日举办的「特斯拉人工智能日(以下简称特斯拉 AI 日)」上,马斯克也已决口不提当年的雄心壮志,而是把目光投向了一项更具科幻色彩的目标:造人。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
这就是特斯拉 AI 日上最精彩一幕:在介绍完各种令人昏昏欲睡的 FSD 开发和 Dojo 超级计算机芯片数据名词后,马斯克话锋一转:「有了如此强大的传感器和数据处理芯片,因此,我们在明年可能会研发出这样一个原型产品。」
随后,一位身穿黑白紧身衣的演员走上前台,疯狂旋转、尬舞。站在一旁的马斯克则打趣道:「这个跳舞的家伙显然不是真正的机器人,但是特斯拉机器人(Tesla Bot)将是真实的。」
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
对这样一个以日本特摄片形式首先展示在人们面前的机器人,马斯克本人也没有更详细的介绍,只用几页 PPT 的寥寥数语,勾勒了大致的轮廓:
「体能」上,Tesla Bot身高约1.73米,体重约56.7公斤,能搬动最多 20 公斤的重物,单只胳膊的最大承重为4.5公斤,能以时速 8 公里/小时的速度奔跑。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
「外观造型」上,大家一眼便知,这台机器人拥有和人类一样的四肢,全身使用轻量化材料和 40 个电子机械传动装置。它的头部,还有张「脸」——一块显示信息的面部显示屏。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
把 Tesla Bot 拆开,隐藏在躯体下的,是特斯拉各项技术的加持:Autopilot 摄像头组成「双眼」、FSD芯片构建起「大脑」、神经网络算法+数据模拟系统+ Dojo 超级算力组成其「灵魂」。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
马斯克表示,最快大约在明年就会推出 Tesla Bot 的原型产品。
至于为什么能做、为什么要做,马斯克的解释是「因为特斯拉已经几乎拥有制造类人机器人所需的部件和技术,特斯拉车辆本身就类似带轮子的机器人」,而打造 Tesla Bot 的目标是「为人服务,对人友好,希望把人从危险、重复、无聊的工作中解放出来。」
「最起码,它应该能胜任去超市买个菜这种简单的工作。」马斯克这样说到。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
Tesla Bot一经发布,媒体报道中就又传出了「马斯克坐实当代钢铁侠」的标题,但是相信大家内心都隐藏着一丝疑惑:这玩意明年真能造出来?马斯克怕不是又在「放卫星」?
对此,在发布会上马斯克的只言片语之中也能找出一点端倪。他自己很诚实地说「这可能不会实现」(probably won ‘t work),并紧接着说,更希望 Tesla Bot 能激起大家的热情,选择加入特斯拉。
要知道,特斯拉 AI 日其实是在美国加州举办的一系列技术讲座,其更重要的目的是招聘机器学习人才。
好吧,特斯拉在造人之前,可能更重要的工作是招人。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
正如文章开头提到的,Tesla Bot堪称是整场特斯拉 AI 日最提神醒脑的环节,但在两个半小时的活动中,它实际仅占了不到 20 分钟的时间。
发布会最重磅内容,还是围绕特斯拉 FSD 自动驾驶技术研发、神经网络学习系统实践、Dojo超级计算机芯片算力等硬核 AI 技术展开。
而之所以把最抓眼球的 Tesla Bot 放在最开头介绍的原因嘛……
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
于是,本着说人话、让大家能明白的原则,在此就从本次发布会最核心的 D1 芯片入手,尝试为大家多聊聊这句苍白乏力的赞叹背后,特斯拉到底有多「牛X」。
对于 Dojo 超级计算机,熟悉特斯拉和自动驾驶技术的朋友相信都有所耳闻,而对更多不关心技术的消费者们来说可能非常陌生。
Dojo来源于日语「道场」,这是一台用来训练特斯拉自动驾驶能力的超级计算机。全球超 100 万辆特斯拉行驶的数据,汇聚到这个「道场」里,帮助特斯拉 FSD 自动驾驶技术不断完善。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
还是觉得一头雾水?我们不妨用三个东西来做类比:
第一个,是电影《黑客帝国》中,当主角 Neo 初次回到现实世界,在脑后插管「一插一拔」之后,醒来对 Morpheus 说出的那句著名的:「I know kongfu(我学会了功夫)」
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
第二个,是英剧《福尔摩斯》中,「卷福」在遇到问题时,开启的「记忆宫殿」。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
第三个,则让我们回到现实,当 AlphaGo 在战胜所有人类顶尖围棋高手后,实现了「自我学习」——自己和自己下棋,到另一个维度不断精进棋艺。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
特斯拉要做 Dojo 超级计算机的逻辑,和上面三个案例的类似,就是把海量特斯拉车辆搜集到的路面数据集中到一个 AI 大脑里面,让计算机自己在「头脑」中模拟各种交通路况,锻炼、优化自动驾驶能力。
这也是马斯克在自动驾驶研发上坚持「视觉识别」而非「激光雷达+高精地图」路线的底层逻辑:自动驾驶,是要让车辆「自己学会开车」,而非遵循地图路线和雷达的反馈来「自动行驶」。
即通过另一个洋气的名词:「神经网络计算」来实现车辆的自动驾驶。
好嘛,还没有正式进入 D1 芯片的介绍,我们又遇到了一个老大难,「神经网络计算」到底是个啥?
本着说人话的原则,我们把一台特斯拉车辆上的 8 颗摄像头类比成车辆的眼睛,能「看到」车辆周围交通状况的视频和图片数据。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
但随后的问题是,「眼睛」看到了,「智商」可能不到位,车辆弄不明白看到的是雪糕筒还是工程车,因此还需要有神经、有大脑。
这又要引出人工智能领域的另一个名词:「监督学习」——数据在给到算法训练前,需要先经过人工标注。
最基础的部分,就是在各种自动驾驶视频中常见的物体上的框框,需要人手工将图片上的机动车、非机动车、行人、红绿灯等用不同形状的框标注出来。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
说句题外话,新华社曾经报道,仅北京一座城市就有 100 多家专门从事数据标注的公司,而全国有超过 1000 万人在从事数据标注工作。这也是一向头顶高精尖光环的人工智能技术却又被揶揄「数字富士康」、「劳动密集型产业」的主要原因。
特斯拉的方式,可以说是把人工标注和机器标注,做一个结合。一方面,开发了 HydraNets (九头蛇网络)多任务学习神经网络,可以同时处理目标检测、交通标志识别、车道预测等等任务。同时,该公司组建了超过 1000 人的数据标签团队,进行数据标签和分析性基础工作。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
这项工作目前也取得了不错的成效:标注的准确性大大提高,同时从 2D 图像标签,进化到了如今的 4D 空间+时间的标签。甚至能够在做一次标签之后,一个摄像头内的标签化图像,就能迁移到其他摄像头。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
目前全球有近 100 万辆特斯拉汽车在公路上行驶,每个月大约会产生超过 2 亿小时的视频数据。有了如此多的数据积累,特斯拉甚至已经能做到在系统中实现「仿真」——将真实世界的事实动态,在系统中重建。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
于是,就有了上面这张看上去很像电子游戏的场景图片,不过这个游戏不是给人玩的,而是模拟不同交通驾驶状况,让特斯拉车辆来「锻炼车技」的。
特斯拉表示,现在标注和仿真系统,可以模拟数量高达3.71亿的数据及场景。
那么,既然有了如此多的数据,特斯拉的系统也能够在云端「仿真」不同的交通路况,靠什么来处理这些数据、使用这个仿真世界、锻炼特斯拉自动驾驶系统呢?
对,就是 Dojo 超级计算机。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
准确地说,此次 AI 日的最重磅消息并不是 Dojo 计算机正式投入使用(马斯克说得等到明年,谁知道会不会跳票),而是展示了 Dojo 超强算力的基础—— D1 芯片。
然后,如果像其他文章中那样介绍 D1 的话,咱们就不得不面对一大堆枯燥乏味的数据和参数……
绕过参数,让我们看看 Dojo 的核心算力是怎么构成的,于是就出现了下面这张曾让我误以为是电池包的「训练模块」。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
Dojo的核心算力组成和电动车电池模组的构成颇为类似,最基础的是 D1 芯片。真想了解参数的硬核读者可以看下面这张图,不愿意费脑子的话,就记住这块芯片算力很牛X。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
然后,25片 D1 芯片组成一个小巧的训练模块,带来更牛X的 9PFLOPS (0.9亿亿次/秒算力,注意不是多打了一个「亿」字。)
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
最后,把 120 个训练模块,相互联结,放到几个机柜里,用 3000 多个 D1 芯片就组成了算力最牛X的Dojo ExaPOD。(超过 100 亿亿次/秒算力。)
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
而如此大的算力之下,特斯拉表示其每单位能耗下的性能比当今最强超级计算机高1.3倍,但碳排放仅为 1/5。
这也是符合特斯拉「最佳 AI 训练性能、更大更复杂神经网络、能耗成本优化」的设计思路。
于是特斯拉很自豪地明确表示:Dojo 就是全球最快的 AI 训练计算机,并且这仅仅只是开始,下一代 Dojo 还将得到 10 倍的性能提升。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
问题是,一直写到最后的时候,我依然有些疑惑,在马斯克亲手将数字货币价格在全球炒上了天、消费级显卡尚一卡难求的当前,如此强大的超级计算机芯片,技术上能实现,产能上真能在明年完成吗?
行吧,还是用这张李安的图片来作为特斯拉 AI 日的结尾吧。
![](https://www.cydao.com/wp-content/themes/justnews/themer/assets/images/lazy.png)
要知道,相比特斯拉超级计算机和马斯克的机器人,其实更让我在意的是前几天一条互联网新闻:「腾讯再投 500 亿助力共同富裕。」
原创文章,作者:超级充电站,如若转载,请注明出处:https://www.cydao.com/3582.html