特斯拉「造人」：我看不懂，但大受震撼

如今，距离 2019 年特斯拉「自动驾驶日」已经过去了两年的时间。

在当年活动上，特斯拉 CEO 埃隆·马斯克对自动驾驶技术未来做出了无数美好的预测。其中最著名的，莫过于那句，在 2020 年中期，将有 100 万辆特斯拉自动驾驶车辆上路，人们驾车时甚至「可以在车上睡觉」。

一晃眼，两年多过去了，特斯拉完全重写的 FSD 系统依然在美国内测。在 8 月19日举办的「特斯拉人工智能日（以下简称特斯拉 AI 日）」上，马斯克也已决口不提当年的雄心壮志，而是把目光投向了一项更具科幻色彩的目标：造人。

这就是特斯拉 AI 日上最精彩一幕：在介绍完各种令人昏昏欲睡的 FSD 开发和 Dojo 超级计算机芯片数据名词后，马斯克话锋一转：「有了如此强大的传感器和数据处理芯片，因此，我们在明年可能会研发出这样一个原型产品。」

随后，一位身穿黑白紧身衣的演员走上前台，疯狂旋转、尬舞。站在一旁的马斯克则打趣道：「这个跳舞的家伙显然不是真正的机器人，但是特斯拉机器人（Tesla Bot）将是真实的。」

对这样一个以日本特摄片形式首先展示在人们面前的机器人，马斯克本人也没有更详细的介绍，只用几页 PPT 的寥寥数语，勾勒了大致的轮廓：

「体能」上，Tesla Bot身高约1.73米，体重约56.7公斤，能搬动最多 20 公斤的重物，单只胳膊的最大承重为4.5公斤，能以时速 8 公里/小时的速度奔跑。

「外观造型」上，大家一眼便知，这台机器人拥有和人类一样的四肢，全身使用轻量化材料和 40 个电子机械传动装置。它的头部，还有张「脸」——一块显示信息的面部显示屏。

把 Tesla Bot 拆开，隐藏在躯体下的，是特斯拉各项技术的加持：Autopilot 摄像头组成「双眼」、FSD芯片构建起「大脑」、神经网络算法+数据模拟系统+ Dojo 超级算力组成其「灵魂」。

马斯克表示，最快大约在明年就会推出 Tesla Bot 的原型产品。

至于为什么能做、为什么要做，马斯克的解释是「因为特斯拉已经几乎拥有制造类人机器人所需的部件和技术，特斯拉车辆本身就类似带轮子的机器人」，而打造 Tesla Bot 的目标是「为人服务，对人友好，希望把人从危险、重复、无聊的工作中解放出来。」

「最起码，它应该能胜任去超市买个菜这种简单的工作。」马斯克这样说到。

Tesla Bot一经发布，媒体报道中就又传出了「马斯克坐实当代钢铁侠」的标题，但是相信大家内心都隐藏着一丝疑惑：这玩意明年真能造出来？马斯克怕不是又在「放卫星」？

对此，在发布会上马斯克的只言片语之中也能找出一点端倪。他自己很诚实地说「这可能不会实现」（probably won ‘t work），并紧接着说，更希望 Tesla Bot 能激起大家的热情，选择加入特斯拉。

要知道，特斯拉 AI 日其实是在美国加州举办的一系列技术讲座，其更重要的目的是招聘机器学习人才。

好吧，特斯拉在造人之前，可能更重要的工作是招人。

正如文章开头提到的，Tesla Bot堪称是整场特斯拉 AI 日最提神醒脑的环节，但在两个半小时的活动中，它实际仅占了不到 20 分钟的时间。

发布会最重磅内容，还是围绕特斯拉 FSD 自动驾驶技术研发、神经网络学习系统实践、Dojo超级计算机芯片算力等硬核 AI 技术展开。

而之所以把最抓眼球的 Tesla Bot 放在最开头介绍的原因嘛……

于是，本着说人话、让大家能明白的原则，在此就从本次发布会最核心的 D1 芯片入手，尝试为大家多聊聊这句苍白乏力的赞叹背后，特斯拉到底有多「牛X」。

对于 Dojo 超级计算机，熟悉特斯拉和自动驾驶技术的朋友相信都有所耳闻，而对更多不关心技术的消费者们来说可能非常陌生。

Dojo来源于日语「道场」，这是一台用来训练特斯拉自动驾驶能力的超级计算机。全球超 100 万辆特斯拉行驶的数据，汇聚到这个「道场」里，帮助特斯拉 FSD 自动驾驶技术不断完善。

还是觉得一头雾水？我们不妨用三个东西来做类比：

第一个，是电影《黑客帝国》中，当主角 Neo 初次回到现实世界，在脑后插管「一插一拔」之后，醒来对 Morpheus 说出的那句著名的：「I know kongfu（我学会了功夫）」

第二个，是英剧《福尔摩斯》中，「卷福」在遇到问题时，开启的「记忆宫殿」。

第三个，则让我们回到现实，当 AlphaGo 在战胜所有人类顶尖围棋高手后，实现了「自我学习」——自己和自己下棋，到另一个维度不断精进棋艺。

特斯拉要做 Dojo 超级计算机的逻辑，和上面三个案例的类似，就是把海量特斯拉车辆搜集到的路面数据集中到一个 AI 大脑里面，让计算机自己在「头脑」中模拟各种交通路况，锻炼、优化自动驾驶能力。

这也是马斯克在自动驾驶研发上坚持「视觉识别」而非「激光雷达+高精地图」路线的底层逻辑：自动驾驶，是要让车辆「自己学会开车」，而非遵循地图路线和雷达的反馈来「自动行驶」。

即通过另一个洋气的名词：「神经网络计算」来实现车辆的自动驾驶。

好嘛，还没有正式进入 D1 芯片的介绍，我们又遇到了一个老大难，「神经网络计算」到底是个啥？

本着说人话的原则，我们把一台特斯拉车辆上的 8 颗摄像头类比成车辆的眼睛，能「看到」车辆周围交通状况的视频和图片数据。

但随后的问题是，「眼睛」看到了，「智商」可能不到位，车辆弄不明白看到的是雪糕筒还是工程车，因此还需要有神经、有大脑。

这又要引出人工智能领域的另一个名词：「监督学习」——数据在给到算法训练前，需要先经过人工标注。

最基础的部分，就是在各种自动驾驶视频中常见的物体上的框框，需要人手工将图片上的机动车、非机动车、行人、红绿灯等用不同形状的框标注出来。

说句题外话，新华社曾经报道，仅北京一座城市就有 100 多家专门从事数据标注的公司，而全国有超过 1000 万人在从事数据标注工作。这也是一向头顶高精尖光环的人工智能技术却又被揶揄「数字富士康」、「劳动密集型产业」的主要原因。

特斯拉的方式，可以说是把人工标注和机器标注，做一个结合。一方面，开发了 HydraNets （九头蛇网络）多任务学习神经网络，可以同时处理目标检测、交通标志识别、车道预测等等任务。同时，该公司组建了超过 1000 人的数据标签团队，进行数据标签和分析性基础工作。

这项工作目前也取得了不错的成效：标注的准确性大大提高，同时从 2D 图像标签，进化到了如今的 4D 空间+时间的标签。甚至能够在做一次标签之后，一个摄像头内的标签化图像，就能迁移到其他摄像头。

目前全球有近 100 万辆特斯拉汽车在公路上行驶，每个月大约会产生超过 2 亿小时的视频数据。有了如此多的数据积累，特斯拉甚至已经能做到在系统中实现「仿真」——将真实世界的事实动态，在系统中重建。

于是，就有了上面这张看上去很像电子游戏的场景图片，不过这个游戏不是给人玩的，而是模拟不同交通驾驶状况，让特斯拉车辆来「锻炼车技」的。

特斯拉表示，现在标注和仿真系统，可以模拟数量高达3.71亿的数据及场景。

那么，既然有了如此多的数据，特斯拉的系统也能够在云端「仿真」不同的交通路况，靠什么来处理这些数据、使用这个仿真世界、锻炼特斯拉自动驾驶系统呢？

对，就是 Dojo 超级计算机。

准确地说，此次 AI 日的最重磅消息并不是 Dojo 计算机正式投入使用（马斯克说得等到明年，谁知道会不会跳票），而是展示了 Dojo 超强算力的基础—— D1 芯片。

然后，如果像其他文章中那样介绍 D1 的话，咱们就不得不面对一大堆枯燥乏味的数据和参数……

绕过参数，让我们看看 Dojo 的核心算力是怎么构成的，于是就出现了下面这张曾让我误以为是电池包的「训练模块」。

Dojo的核心算力组成和电动车电池模组的构成颇为类似，最基础的是 D1 芯片。真想了解参数的硬核读者可以看下面这张图，不愿意费脑子的话，就记住这块芯片算力很牛X。

然后，25片 D1 芯片组成一个小巧的训练模块，带来更牛X的 9PFLOPS （0.9亿亿次/秒算力，注意不是多打了一个「亿」字。）

最后，把 120 个训练模块，相互联结，放到几个机柜里，用 3000 多个 D1 芯片就组成了算力最牛X的Dojo ExaPOD。（超过 100 亿亿次/秒算力。）

而如此大的算力之下，特斯拉表示其每单位能耗下的性能比当今最强超级计算机高1.3倍，但碳排放仅为 1/5。

这也是符合特斯拉「最佳 AI 训练性能、更大更复杂神经网络、能耗成本优化」的设计思路。

于是特斯拉很自豪地明确表示：Dojo 就是全球最快的 AI 训练计算机，并且这仅仅只是开始，下一代 Dojo 还将得到 10 倍的性能提升。

问题是，一直写到最后的时候，我依然有些疑惑，在马斯克亲手将数字货币价格在全球炒上了天、消费级显卡尚一卡难求的当前，如此强大的超级计算机芯片，技术上能实现，产能上真能在明年完成吗？

行吧，还是用这张李安的图片来作为特斯拉 AI 日的结尾吧。

要知道，相比特斯拉超级计算机和马斯克的机器人，其实更让我在意的是前几天一条互联网新闻：「腾讯再投 500 亿助力共同富裕。」

原创文章，作者：超级充电站，如若转载，请注明出处：https://www.cydao.com/3582.html

特斯拉「造人」：我看不懂，但大受震撼

相关推荐