2月7日动静,多年来,埃隆·马斯克(Elon Musk)一曲正在谈论Dojo——这台将成为特斯拉人工智能计谋焦点的超等计较机。Dojo的主要性不问可知,2024年7月,马斯克曾暗示,公司AI团队将正在10月机械人出租车发布前“加倍投入”Dojo,以加快其成长。简而言之,Dojo是特斯拉自从研发的超等计较机,公用于锻炼“完全从动驾驶”(FSD)神经收集。加强Dojo的计较能力,是特斯拉实现完全从动驾驶并鞭策机械人出租车落地的主要一环。目前,已无数百万辆特斯拉汽车搭载FSD,可以或许施行部门从动驾驶使命,但仍然需要驾驶员全程连结留意力。特斯拉已发布Cybercab机械人出租车,并打算于本年6月正在奥斯汀推出自有车队的从动叫车办事。此外,公司正在2024年第四时度财报电线年正在美国推出无人监管的FSD办事。马斯克曾强调,Dojo是实现完全从动驾驶的环节。然而,现在特斯拉似乎已接近这一方针,他却对Dojo连结缄默。自2024年8月起,业界的关心点已转向Cortex——特斯拉正在奥斯汀总部打制的全新AI锻炼超等集群,旨正在处理现实世界的AI问题。马斯克暗示,Cortex将具备“海量存储能力”,公用于锻炼FSD和Optimus机械人。正在2024年第四时度股东会上,特斯拉更新了Cortex的进展,却未提及Dojo。特斯拉正大举投资AI、Dojo和Cortex,以推进汽车及人形机械人的从动化。考虑到电动车市场所作日益激烈,特斯拉将来的成功很大程度上取决于其正在AI范畴的冲破。因而,深切领会Dojo、Cortex及其成长示状,变得尤为主要。马斯克的方针远不止于制车,他但愿特斯拉成为一家AI公司,通过模仿人类,破解从动驾驶的焦点难题。目前,大大都从动驾驶企业依赖多种传感器(如激光雷达、雷达和摄像头)及高精度地图进行定位,而特斯拉仅依托摄像头采集视觉数据,并通过神经收集进行处置,从而实现从动驾驶。特斯拉前AI担任人安德烈·卡帕西(Andrej Karpathy)正在2021年AI Day上曾暗示,公司试图“从零起头建立一种合成动物”。比拟之下,Alphabet旗下Waymo等公司已通过传感器取机械进修的保守方式,贸易化L4级从动驾驶汽车,可正在特定前提下实现完全无人驾驶。但特斯拉至今尚未推出不需要驾驶员的从动驾驶系统。目前,约180万用户领取8000至1。5万美元订阅FSD。特斯拉打算通过Dojo锻炼AI软件,并以OTA(无线更新)体例推送至用户车辆。特斯拉的大规模摆设,使其堆集了海量驾驶视频数据,以锻炼FSD。公司的焦点逻辑是:数据越多,越接近实现实正的完全从动驾驶。普渡大学硅谷电子取计较机工程传授阿南德·拉格纳坦(Anand Raghunathan)暗示:“起首,经济成本会成为要素,锻炼过程很快会变得极其高贵。”此外,他指出,“有些人认为,我们可能会耗尽有价值的数据。更大都据不等于更多消息,环节正在于这些数据能否实正有帮于建立更好的模子,以及锻炼过程可否无效提炼这些消息。”虽然存正在这些质疑,短期内数据驱动的趋向仍将持续。而数据的增加意味着更高的计较需求,以存储和处置这些消息,锻炼特斯拉的AI模子。这恰是Dojo的用武之地。Dojo是特斯拉专为人工智能锻炼打制的超等计较机系统,次要用于FSD神经收集的锻炼。其名称来历于技击场“道场”(Dojo),寄意其做为AI锻炼平台的焦点感化。一台超等计较机由成千上万个称为“节点”(node)的小型计较机构成。每个节点都配备本人的地方处置器(CPU)和图形处置器(GPU)。CPU担任全体办理,而GPU则处置高强度计较使命,例如将复杂运算拆分成多个并行使命。GPU正在机械进修范畴至关主要,特别是正在FSD模仿锻炼中。它们同样驱动着狂言语模子的成长,这也是为何生成式人工智能的兴起,使英伟告竣为全球市值最高的科技公司之一。特斯拉采用“纯视觉”方案进行从动驾驶,这恰是其需要超等计较机的焦点缘由。FSD神经收集依赖海量驾驶数据进行锻炼,以识别和分类道上的物体,并做出驾驶决策。当FSD激活时,神经收集需要持续及时收集和处置视觉数据,其处置速度必需取人类的视觉能力相婚配。要实现这一方针,特斯拉必需存储并处置从全球车辆收集的海量视频数据,并运转数百万次模仿锻炼AI模子。目前,特斯拉依赖英伟达GPU支持其Dojo计较系统,但它并不单愿完全依赖第三方芯片,缘由包罗英伟达芯片成本昂扬,以及特斯拉但愿打制更高效、低延迟的计较系统。因而,公司AI团队决定开辟自研硬件,以比保守系统更高效地锻炼AI模子。特斯拉取苹果雷同的,认为软硬件应协同设想,以提拔全体机能。因而,特斯拉努力于脱节对尺度GPU硬件的依赖,转而开辟自家芯片来驱动Dojo。2021年,正在特斯拉AI Day上,公司发布了D1芯片——一块手掌大小的硅芯片。D1芯片由台积电(TSMC)采用7纳米工艺制制。据特斯拉引见,该芯片具有500亿个晶体管,芯全面积达645平方毫米,专为高效计较和快速处置复杂使命而设想。“我们可以或许同时进行计较和数据传输,我们自研的指令集架构(ISA)完全针对机械进修使命进行了优化,”特斯拉前从动驾驶硬件高级从管甘纳什·文卡塔拉马南(Ganesh Venkataramanan)正在2021年AI Day上暗示,“这是一款纯粹为机械进修打制的芯片。”然而,目前D1芯片的机能仍不及英伟达A100 GPU,后者同样由台积电采用7纳米工艺制制,具有540亿个晶体管,芯片尺寸更大(826平方毫米),因而计较能力略强于D1。为了进一步提拔计较能力和数据吞吐量,特斯拉的AI团队将25颗D1芯片集成为一个计较单位(Tile)。每个Tile的计较机能为9万万亿次浮点运算/秒(9 petaflops),带宽达到36太字节/秒(36TB/s),并内置所有所需的电源、冷却和数据传输硬件。能够将Tile理解为由25个计较单位构成的“小型超等计较机”。正在2022年AI Day上,特斯拉暗示,Dojo的计较能力将通过摆设多个ExaPOD进行扩展。这些模块化架构配合构成特斯拉的超等计较集群。此外,特斯拉正正在研发新一代D2芯片,以处理消息流瓶颈。D2芯片将分歧的计较单位间接集成至单片硅片上,而非通过互连多个芯片,从而提拔计较效率并降低延迟。特斯拉尚未披露D1芯片的具体订单量或估计交付数量,也未发布Dojo全面启用D1芯片的时间表。2024年6月,一位用户正在社交平台X上发帖称:“埃隆正正在得克萨斯州建制一个庞大的GPU冷却系统。特斯拉的方针是正在将来18个月内实现“50%利用特斯拉自研AI硬件,50%利用英伟达/其他芯片”。“其他”可能包罗AMD芯片,这一点获得了马斯克2024年1月简直认。控制自研芯片出产,意味着特斯拉将来可能以更低成本快速扩展AI算力,出格是正在特斯拉取台积电扩大芯片产能的环境下。正在2024年第二季度财报德律风会议上,马斯克曾暗示,英伟达硬件的需求“高得惊人,以致于我们很难不变采购到所需的GPU。”他弥补道:“我很是担忧,我们能否可以或许按需获取脚够的GPU,因而,我们必需加大对Dojo的投入,以确保具备所需的锻炼能力。”也就是说,虽然特斯拉仍正在利用英伟达芯片锻炼AI,但它正正在勤奋降低对英伟达的依赖。客岁6月,马斯克正在X平台发文称:“特斯拉本年正在AI相关范畴的收入大约为100亿美元,此中约一半用于内部研发,车辆上的传感器以及Dojo。至于AI锻炼超等计较集群的扶植,英伟达硬件约占成本的三分之二。我目前估量,特斯拉本年正在英伟达芯片上的采购收入将正在30亿至40亿美元之间。”值得留意的是,“推理计较”指的是特斯拉汽车正在及时运转过程中施行的AI计较,取Dojo担任的AI锻炼计较是分隔的。从久远来看,特斯拉大概能够依托AI部分斥地全新的贸易模式。马斯克曾暗示,首个版本的Dojo专为特斯拉计较机视觉数据的标注取锻炼而设想,这对于FSD和人形机械人Optimus的锻炼至关主要,但用处较为局限。不外,将来版本的Dojo将愈加合用于通用AI锻炼。然而,这也面对一个严沉挑和——当前几乎所有AI软件都是基于GPU架构开辟的。若是要让Dojo用于通用AI模子锻炼,就必需对软件进行沉构。除非特斯拉选择向外部租赁其计较能力,就像AWS和Azure供给云计较办事那样。现实上,马斯克正在2024年第二季度财报德律风会议上提到,他认为“Dojo将来有潜力正在算力合作中取英伟达一较高下。”摩根士丹利正在2023年9月的一份演讲中预测,Dojo能够通过从动驾驶出租车和AI软件办事等新营业模式,为特斯拉带来额外的收入增加,以至可能为公司市值贡献5000亿美元。此前有报道,特斯拉于2023年7月起头出产Dojo。然而,马斯克正在2023年6月的一篇帖子中暗示,Dojo“曾经上线并施行有用使命数月”。特斯拉曾暗示,到2024年2月,Dojo将跻身全球五大最强超等计较机之列。但截至目前,特斯拉尚未公开披露相关消息,因而这一方针能否告竣仍存疑。此外,特斯拉还估计,到2024年10月,Dojo的合计算能力将达到100 ExaFLOPS(每秒100万亿亿次浮点运算)。按照计较,假设每块D1芯片的算力为362 TFLOPS(每秒362万亿次浮点运算),特斯拉需要跨越27。6万块D1芯片,或约32。05万块英伟达A100 GPU,才能达到这一方针。特斯拉曾正在2024年1月许诺投资5亿美元,正在纽约州布法罗的超等工场扶植一台Dojo超等计较机。2024年5月,马斯克透露,特斯拉奥斯汀超等工场的后部将留做“超稠密水冷超等计较集群”——但现正在我们晓得,这一空间现实上用于摆设Cortex,而非Dojo。正在2024年第二季度财报德律风会议竣事后,马斯克正在X平台上发文称,特斯拉AI团队正正在利用Tesla HW4 AI计较机(现改名为AI4),取英伟达GPU连系进行锻炼。他提到,当前锻炼集群中包含:马斯克弥补道:“到岁尾,Dojo 1的锻炼能力将相当于8000块H100 GPU。这不算复杂,但也不容小觑。”截至目前,特斯拉尚未确认这些芯片能否已全面上线并支撑Dojo运转。正在2024年第四时度财报德律风会议上,Dojo以至未被提及。相反,特斯拉颁布发表已正在Q4完成Cortex的摆设,并暗示Cortex是鞭策FSD V13版本实现的环节。(辰辰)。
上一篇:2025年曲播必备神器!这几款AI手机无人从动曲播