Sources

# 特斯拉FSD更新及算法和训练数据中心的情况 本文来自知识星球“AI基础设施”,作者郁愈。 2024年12月8日 >特斯拉FSD (Full Self-Driving) 系统也在不断进化,最新的FSD v13(监督模式)更新带来了许多重要的技术升级。这些更新不仅增强了自动驾驶系统的安全性、智能性和反应速度,还提高了用户的驾驶体验。今天,我们就来详细解读一下。 ## v13更新的功能 - 更高的图像输入精度:36Hz全分辨率AI4视频输入 在FSD v13中,系统的图像处理能力得到了显著提升。通过引入36Hz的全分辨率AI4视频输入,FSD系统可以每秒采集36帧高清图像,并进行深度学习处理。这意味着车辆能够更快速、更精确地感知周围环境,确保在各种驾驶场景下都能做出更准确的决策。 注:AI4也就是硬件4.0,AI4具有高分辨率摄像头,能够更好地识别细节。前置摄像头的分辨率为 2896x1876 像素,而硬件3.0 的分辨率为 1280x960 像素。算力方面,据马斯克介绍,AI4.0的速度比Hardware 3.0大概快3-5倍。 - 强大的神经网络架构和原生AI4输入 新版本的FSD系统采用了更先进的神经网络架构,并原生支持AI4输入。 - 大幅提升的数据处理能力:4.2倍数据扩展 随着4.2倍数据扩展的引入,FSD系统可以处理更大范围和更丰富的数据。所以车辆在行驶过程中,能够获得更多的实时信息,并根据这些数据做出更精准的决策,提升整体驾驶安全性。 - 5倍计算能力提升:得益于Cortex集群 FSD v13利用Cortex集群的强大计算能力,提供了5倍的训练计算扩展。这种提升使得系统能够在更短的时间内完成复杂的计算任务,提升模型训练的速度和精度,从而加快自动驾驶技术的迭代和优化。 - 光子到控制的延迟减少2倍 FSD v13通过技术优化,成功将光子到控制的延迟减少了2倍。所以,从摄像头捕捉到周围环境的光信号,到系统做出控制决策并执行的响应时间大幅缩短,车辆的反应速度更快,能够更加敏捷地应对突发情况。 - 更智能的速度档案:城市与高速公路双重适应 FSD v13引入了城市街道与高速公路的速度档案,根据不同的驾驶环境,自动调整车辆的行驶速度。这一更新让系统能够在不同的道路类型上做出更合适的速度选择,不仅提高了驾驶的舒适度,还能更好地适应复杂的交通情况。 - 一键启动FSD(监督模式):从停车到行驶 FSD v13新增了一键启动功能,用户可以从停车状态轻松启动车辆,系统自动切换到FSD(监督模式)。这一设计让用户在需要使用自动驾驶时更加便捷,只需按下按钮即可让车辆进入自动驾驶状态。 - 智能停车与倒车:集成停车、撤离与倒车功能 FSD v13进一步增强了车辆的停车功能,新增了集成的撤离停车位、倒车和停车能力。系统能够根据周围环境的变化,自动完成停车、倒车、撤离停车位等任务,减少驾驶员的操作复杂性,提升自动驾驶的便利性。 - 改进的碰撞避免预测:更智能的安全性 FSD v13加强了碰撞避免的奖励预测系统,通过优化系统的预测能力,能够提前识别潜在的碰撞风险,并采取相应的避让动作。 - 优化的摄像头清洁功能 - 更加精确的跟踪:重新设计的控制器 - 动态路径规划:绕过道路封闭 ## 即将到来的更新 FSD v13的升级还预告了即将到来的更新 - 3x模型大小扩展 这一更新将模型的规模扩展为原来的三倍。 - 3x模型上下文长度扩展 这样FSD系统能够处理更长时间的上下文信息。这有助于系统在决策时考虑更长时间内的道路状况、交通流量、车辆行为等因素。例如,当车辆在高速公路上行驶时,系统可以回顾并分析更长时间的数据,以预测前方的交通变化,做出更合理的反应。 - 音频输入,用于更好地处理紧急车辆 FSD将引入音频输入,以帮助系统更好地识别紧急车辆(如警车、救护车等)的声音。这项功能可以帮助自动驾驶系统更快地感知和响应紧急车辆的存在,例如在交通繁忙的情况下,为紧急车辆让路,从而提高安全性。 在传统依赖视觉数据的基础上纳入了音频输入。这一发展标志着 FSD 系统处理信息的方式发生了重大转变,从纯粹基于视觉的方法转向了纳入听觉信号的方式。 音频输入将通过车辆位于后视镜附近的内置麦克风进行处理。这个麦克风会捕捉周围环境中的声音,使完全自动驾驶系统能够将听觉信号作为其决策过程的一部分加以解读。 纳入音频输入旨在使特斯拉的完全自动驾驶系统更贴近人类驾驶行为。正如人类驾驶员依靠视觉和听觉来应对周边环境一样,特斯拉力求在其自动驾驶系统中复制这种双感官的应对方式。 - 改进的导航奖励预测 系统将在导航过程中使用更先进的奖励预测机制,以优化路线选择。未来的FSD系统可以更智能地评估当前路线的优劣,考虑更多因素(如交通、路况、交通信号等),并选择最优路线。改进的奖励预测将帮助系统更高效地规划路径,减少交通阻塞,提升驾驶效率。 - 改进的停车场中的虚假刹车和慢速驾驶问题 - 支持目的地选项,包括停车、停车位、车道或车库 - 高效的地图和导航输入表示 - 改进的摄像头遮挡处理能力 据报道,FSD(Supervised)V13 是特斯拉数据、视觉、编译器、系统、固件、UI、QA、PM 等多个团队合作的结晶。这也是第一个专为特斯拉 HW4 硬件做优化和重构的 FSD 版本。 FSD V13是完全重写的。当被问及FSD V12到V13之间的飞跃是否比FSD V11 到V12之间的飞跃更大时,特斯拉人工智能团队成员指出,V13 的构建与SpaceX为Starship设计的Raptor Engine V3 非常相似。 马斯克也表示v13版本FSD预计将比v12.5.5.3要好5倍以上。 虽然FSD迭代的速度非常快,但是要实现真正无人监管的车辆,无需人员远程监控可能要至少等到v14 版本以后,实现比人类更低的脱离率(Disengagement Ratio)。 FSD V13 可以实现从任意停车位自主启动,可以自主挂倒挡。这意味着 V13 并不需要专门的“建图”环节,或者说它的功能逻辑完全就是人类开车出行的逻辑:看情况出发,看情况停车,核心在于“看情况”。 ## Cortex数据中心助力FSD提升 特斯拉表示,FSD 过去一年的显著改进归因于训练计算能力的增加,从 20000 个 GPU 增加到大约 90000 个 GPU,仅用了 10 个月的时间。这些GPU来自得克萨斯州奥斯汀市的特斯拉总部的Cortex AI supercomputer。 这个集群具有以下特点: - 庞大的规模: “Cortex” 超级集群将由大约 70000 台AI服务器组成。 最初,它将配备 50000 个英伟达 H100 以及 20000 套特斯拉定制的人工智能硬件,并且随着需求增长还计划进行扩容(目前看有90000个了)。 - 电力及冷却需求 启用时,该超级集群将需要约 130 兆瓦的电力及冷却功率,预计到 2026 年这一需求将增至 500 兆瓦。 - 采用了先进的液体冷却解决方案。 - 数据处理能力 “Cortex” 专为训练特斯拉的 “完全自动驾驶”(FSD)系统以及 “Optimus” 人形机器人而打造。该设施将处理这些应用所需的海量数据,包括训练自动驾驶系统必不可少的视频数据。 其基础设施有望支持汽车应用之外多个领域的高级人工智能训练,可能会对机器人技术和能源管理等行业产生影响。

Podcast Editor
Podcast.json
Preview
Audio