中国顶尖的人工智能公司DeepSeek有限公司据报道,由于无法获得足够的英伟达图形处理单元,该公司在开发下一代R2推理模型时遇到了障碍。
《信息》援引两位熟悉DeepSeek情况的匿名消息人士称,该公司已经为即将推出的R2模型工作了几个月,但其首席执行官梁文峰对其尚不满意。然而,由于手头的GPU数量有限,公司无法提升其能力。
DeepSeek今年早些时候因推出其原始推理模型R1而声名鹊起,该模型被证明完全可以媲美美国公司如OpenAI、Anthropic PBC和Meta Platforms Inc.开发的最先进模型,尽管其成本仅为后者的一小部分。
据《信息》报道,DeepSeek在一个由50,000个Hopper GPU组成的集群上训练了R1,其中包括约10,000个H100、10,000个H800和约30,000个专为中国市场定制的低功耗H20 GPU。
中国公司从未能合法购买H100或H800 GPU,据说其中一些是由其投资者高飞资本管理公司秘密提供给DeepSeek的,而另一些则通过壳公司采购,利用公共云基础设施服务。H20 GPU是合法获得的,但由于美国政府的新制裁,禁止其出口到中国,现在也变得难以获得。
问题的一部分在于中国的许多H20 GPU已经被DeepSeek的客户使用。《信息》称,R1模型已被中国公司和政府机构广泛采用,其中大多数在云端运行H20 GPU。因此,DeepSeek没有更多的容量来训练其最新模型。
据说H20 GPU的短缺已经对R1造成了问题,限制了中国公司对其的使用。如果R2模型在R1的基础上有显著改进,预计对该模型的需求将超过中国云基础设施提供商的承受能力,正如《信息》采访的员工所说。
H20处理器可与英伟达出售给西方公司的H100 GPU相媲美,但其带宽和连接性已被限制,以符合早期对可出口到中国的芯片类型的限制。然而,特朗普政府决定,即使是这种缩减版的芯片也太强大,不能运往其地缘政治对手,并迅速对该国施加了新的限制在四月,禁止其出口。
据报道,这一决定对中国的AI开发者造成了重大障碍。虽然有一些国内替代品可用,如华为技术有限公司的Ascend 910B芯片组,但这些芯片组甚至比H20更不强大,并且不支持英伟达的CUDA软件栈——一种用于优化应用程序和AI模型以在英伟达GPU上运行的编程架构。这是个问题,因为几乎所有中国AI开发者都被认为在使用CUDA软件。
DeepSeek的R1和R2模型也针对英伟达的芯片进行了优化,无法获得这些芯片可能会对其与美国竞争对手保持同步的努力造成重大挫折。