谷歌TPU的存在为OpenAI节省了30%的Nvidia芯片成本

2025年12月01日 由 alex 发表 4656 0

google_nvidia-e1764415682614-1200x654


谷歌正从内部芯片用户转型为零售商,这一举措直接挑战了英伟达的市场主导地位。一项新分析显示,谷歌最新TPU的存在本身就已经在推低AI计算能力的价格。


多年来,谷歌几乎只为自家AI模型使用张量处理单元(TPU)。这一策略在新的TPUv7“铁木”中发生了变化。根据SemiAnalysis芯片专家的分析,谷歌现在正积极向第三方出售其芯片,将自己定位为英伟达的直接竞争对手。


Anthropic是客户名单的头条。分析显示,这家初创公司的交易涉及约一百万个TPU,分配在直接硬件购买和通过谷歌云平台(GCP)进行云租赁之间。据报道,运行这些硬件所需的基础设施消耗超过一吉瓦的电力。


市场已经感受到冲击。SemiAnalysis报道,OpenAI仅凭可信的威胁将转向TPU或其他替代方案,就为其英伟达车队争取到了大约30%的折扣。


分析师Dylan Patel、Myron Xie和Daniel Nishball写道:“你买的(TPU)越多,你节省的(NVIDIA GPU资本支出)就越多,”这是对英伟达CEO黄恩森著名口号“买得越多,省得越多”的俏皮变奏。


TPU证明了它们能够处理顶级AI模型

使用数据显示,TPU已不再是二线替代品。最近发布的两款最强大的AI模型——谷歌的Gemini 3 Pro和Anthropic的Claude 4.5 Opus——主要依赖谷歌TPU和亚马逊的Trainium芯片。双子座3号完全依靠TPU训练。


根据SemiAnalysis的数据,技术上,TPUv7“铁木”在理论计算能力(FLOP)和内存带宽方面几乎与英伟达的布莱克韦尔一代持平。但真正的杀手镥是价格。


对于谷歌来说,每颗芯片的总拥有成本(TCO)大约比同类的英伟达GB200系统低44%。即使是像Anthropic这样支付加价的外部客户,根据分析师的模型,每个有效计算单元的成本也可能比英伟达系统低30%到50%。


这种优势对优化软件的团队来说是可行的。谷歌系统最多可将9,216颗芯片连接到一个密集网络的单一域。这种架构相比传统英伟达系统(通常只将64到72颗芯片密集聚集在一起)更易于分散大规模AI训练运行。


软件更新旨在打破CUDA的锁定

软件长期以来一直是TPU采用的最大障碍,英伟达的CUDA平台成为行业标准。谷歌正在大力投资以消除这一障碍。报告指出,公司正在开发对流行PyTorch框架的原生支持,并与vLLM等推理库集成。


目标是让TPU成为一个可行的替代方案,同时不强迫开发者重建整个工具链。然而,TPU软件栈的核心——XLA编译器——仍然是专有的。SemiAnalysis认为这是一个错失的机会,因为开源本可以加速更广泛社区的采纳。


为了部署如此庞大的硅片,谷歌正在利用创新融资。该公司正在与Fluidstack等“新云”公司以及像TeraWulf这样的加密矿工合作。在这些交易中,谷歌常常充当财务后备:如果运营商失败,谷歌保证租金支付。这一策略能够快速将现有的加密挖矿数据中心转变为人工智能设施。


英伟达的下一代可能会抹去价格优势

面对谷歌成功的压力,英伟达正在准备一场技术反击。其下一代“Vera Rubin”芯片预计于2026年或2027年推出,将采用激进的设计选择,如HBM4内存和极高带宽。


谷歌计划中的应对方案TPUv8,根据SemiAnalysis的说法,采用了双重策略。公司计划发布两个变体:一个与长期合作伙伴博通(代号“Sunfish”)共同开发,另一个与联发科(代号“Zebrafish”)合作开发。尽管如此,设计显得保守。分析师指出,该项目存在延误,且依赖架构避免了竞争对手中激进使用台积电的2纳米工艺或HBM4。


对谷歌来说,风险极大。如果英伟达能很好地利用Rubin的性能提升,TPU目前的成本优势可能会消失。SemiAnalysis警告称,英伟达的Rubin系统——特别是“凯伯机架”——在内部工作负载下,甚至比谷歌自家的TPUv8更经济。


“谷歌已经展示了这些卡片,现在英伟达必须执行任务,以保持食物链顶端的雄狮地位,”SemiAnalysis总结道。如果市场领导者完美执行其路线图,它就能保持领先地位。但如果英伟达在性能上出现失误或错过Rubin计划,其主导地位可能会面临严重威胁。

文章来源:https://the-decoder.com/the-mere-existence-of-google-tpus-reportedly-saved-openai-30-on-nvidia-chips/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消