
英伟达公司对人工智能开发商Thinking Machines Lab Inc.进行了“重大投资”,这是双方合作的一部分。今天宣布了这一消息。
注入的资金规模尚未披露。然而,双方透露,Thinking Machines将从英伟达购买价值数十亿美元的硬件,作为交易的一部分。
这家初创公司此前筹集了20亿美元的种子资金,投资方包括英伟达、超威半导体公司、ServiceNow公司和其他科技公司。那次投资使其估值达到120亿美元。目前尚不清楚英伟达的最新投资是否提高了其估值。
Thinking Machines由首席执行官Mira Murati(如图,右,与英伟达CEO黄仁勋合影)于去年二月创立,她曾是OpenAI集团PBC的首席技术官。在那里,她负责监督ChatGPT、Sora视频生成器和其他多个产品的开发。
Thinking Machines去年推出了其首个产品,一项名为Tinker的云服务。它使开发者能够创建经过微调或定制的开源大型语言模型版本。该服务支持十多个LLM,包括Meta Platforms Inc.的Llama系列中的几个。
Tinker使用一种名为LoRA的技术来驱动客户的微调模型。LoRA通过将少量定制的模型权重附加到开源LLM上来进行微调。这种安排消除了修改LLM现有权重的需要,从而降低了训练成本。
作为与英伟达新宣布的合作的一部分,Thinking Machines将从这家芯片制造商购买至少1吉瓦的计算硬件。去年,英伟达CEO黄仁勋估计1吉瓦的AI计算能力建设成本约为500亿美元。图形处理单元占总成本的三分之二。
Thinking Machines计划在项目中使用英伟达最新一代的Rubin GPU。该芯片系列包括两个加速器。第一个,Rubin CPX,针对运行推理工作负载所涉及的特定计算子集进行了优化。另一个芯片,简单称为Rubin,支持更广泛的用例,并具有3360亿个晶体管。
Thinking Machines还将使用英伟达的Vera中央处理器。每个CPU包括88个使用Armv9.2指令集的核心,并能运行176个线程。根据公司表示,Thinking Machines计划在明年初开始部署这些硬件。
英伟达与这家AI开发商的合作还扩展到其他领域。特别是,双方计划开发“用于英伟达架构的训练和服务系统”。他们没有具体说明这些系统是软件还是硬件。
“服务系统”一词通常指开发者用来驱动其推理工作负载的软件栈。此类软件执行诸如在GPU之间分配推理相关计算的任务。英伟达已经有一个名为Dynamo的开源服务系统。
“这种合作加速了我们构建AI的能力,使人们能够塑造和拥有自己的AI,同时也塑造了人类的潜力,”Murati说。
Thinking Machines可能计划使用从英伟达订购的大量硬件来支持新产品。最近的两个职位发布表明该公司正在开发针对音频处理和视觉推理优化的AI模型。它还在开发AI模型构建模块的定制实现,例如Transformer架构的注意力模块。
