谷歌发布Ironwood：其迄今为止“最强大”和“节能”的AI芯片 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

Gemini_Generated_Image_6y78ms6y78ms6y78-770x770

这家科技巨头发布了Ironwood，这款最新的AI芯片被称为“迄今为止最强大且最节能的”，承诺在大规模推理和模型训练中实现性能效率的十倍提升。

由谷歌云高管Amin Vahdat和Mark Lohmeyer宣布，Ironwood TPU专为最苛刻的工作负载而设计，标志着谷歌所称的“推理时代”的到来。

推理成为AI的新竞技场

谷歌正在将这一转变视为行业的转折点，从教AI到全天候运行。在这个“推理时代”中，重点在于性能、响应能力以及通用计算与机器学习加速器之间的无缝协调。推理时代”，重点在于性能、响应能力以及通用计算与机器学习加速器之间的无缝协调。

随着模型演变以处理实时推理和决策，谷歌表示，下一次突破将来自系统级设计，而不仅仅是更大的数据集或更复杂的架构。这一理念是Ironwood的基础：一款为动态AI提供动力的芯片。

将AI性能推向新的极限

谷歌的新Ironwood TPU被设计用于处理最重的AI工作负载，从大规模模型训练到快速推理，以速度和效率的飞跃重新定义其硅芯片系列。

该芯片提供了TPU v5p的10倍峰值性能和其前身Trillium（v6e）4倍以上的每芯片性能，使其成为谷歌最先进的AI模型训练和服务处理器。

Ironwood采用增强的冷却、可靠性和电源效率设计，适用于“行星级”部署，能够在数千个芯片上扩展而不失去稳定性。

早期采用者已经在测试这一承诺。Anthropic计划利用多达100万个TPU来服务其Claude模型，而Lightricks和Essential AI报告称生成质量和训练效率大幅提升。

Anthropic计算负责人James Bradbury表示：“Ironwood在推理性能和训练可扩展性方面的改进将帮助我们在保持客户期望的速度和可靠性的同时高效扩展。”

9000个芯片如同一个思考

Ironwood并非独立存在——它是谷歌AI超级计算机的核心，一个让数千个处理器协同工作的系统。

每个超级节点通过9.6太比特每秒的网络连接多达9216个TPU，使芯片几乎可以即时通信并作为一个统一的系统运行。这些节点共享1.77拍字节的超高速内存，消除了通常阻碍大规模AI处理的数据瓶颈。

实际上，这意味着巨大的模型，如聊天机器人、图像生成器或研究系统，可以更快、更高效地运行且不中断。通过让数千个芯片无缝协作，谷歌可以为使用其AI基础设施的企业和开发者提供更快的响应、更低的延迟和更流畅的性能。

为了保持这个庞大网络的顺畅运行，谷歌依赖于光路交换——一种自愈织物，在中断发生时立即重新分配工作负载。公司表示，自2020年以来，其舰队保持了99.999%的正常运行时间，得益于先进的液体冷却和自动化集群管理。

一个共同设计的软件层，包括Kubernetes集群管理器、MaxText、vLLM和GKE推理网关，帮助从硬件中榨取每一分性能，降低延迟并降低为行星级规模运营的客户的服务成本。

Axion在电力与实用性相遇的地方介入

与Ironwood一起，谷歌推出了Axion，其新的基于Arm的CPU系列，旨在为保持AI系统顺畅运行的日常计算提供动力。该系列包括N4A（现已预览）和即将推出的C4A Metal。两者都旨在提供高达两倍于可比x86虚拟机的性价比。

简单来说，它们承诺以更低的成本和能耗提供更多的计算能力，使企业更容易和更便宜地运行AI所依赖的支持任务，从数据处理和分析到应用托管和系统管理。

测试Axion的公司表示，改进已经显而易见。例如，Vimeo报告视频转码性能提升了30%，而ZoomInfo测量到核心数据工作负载的性价比提升了60%。Rise表示，新实例帮助减少了20%的计算消耗，同时保持低延迟和强劲的利润率。

Ironwood和Axion为谷歌提供了一记组合拳：大规模AI的原始加速与高效的通用计算相结合，适用于其周围的一切。这是一个为智能永不停歇的未来而构建的全栈战略，云本身也在学习更快地思考。