
七个月后签署与Nvidia公司达成200亿美元的芯片授权协议后,Groq公司今天宣布已筹集到6.5亿美元的资金。
成长型投资公司Disruptive和对冲基金Infinitum领投了这一轮融资。
Groq开发了一种名为LPU的芯片设计,专门针对人工智能推理工作负载进行优化。去年12月,Nvidia同意授权支持该处理器的技术,并聘请了Groq的几位关键员工,包括其创始首席执行官。
这笔交易促成了Nvidia Grok LPU 3的诞生,这是一款推理处理器,芯片巨头在三月份推出。它作为一个机架大小的液冷设备的一部分发货,称为LPQ。该系统包括32个托盘,每个托盘包含三个Groq LPU 3单元、一个中央处理器和网络设备。
推理集群中的每个加速器都包含一个称为时钟的石英晶体,用于调节处理速度。时钟在协调芯片之间的数据流动中也起着重要作用。当加速器的时钟不同步时,数据流量会减慢,从而对AI模型的响应时间产生负面影响。
LPU 3具备自动修复时钟漂移的功能,以避免数据流量瓶颈。根据Nvidia的说法,该芯片包括92条通道,每条通道可以以每秒112千兆比特的速度将数据传输到其他处理器。这相当于每秒2.5太比特的双向带宽。
加速芯片之间的数据流动并不是LPU 3加速推理工作负载的唯一方式。该处理器配备了500兆字节的片上SRAM,这是一种高速内存类型。SRAM比其他AI加速器用于存储数据的片外RAM性能更好,这意味着推理速度更快。
Groq运营着一个由LPU驱动的云平台,公司可以使用该平台运行推理工作负载。公司今天披露,该平台每周为500万开发者处理数万亿个令牌。
Groq的云在跨越多个大陆的13个数据中心运行。公司将利用其融资轮的收益来增加其推理能力,目标是在2027年达到200兆瓦。根据Groq的说法,一些新的处理能力将由Nvidia在三月份推出的液冷LPU 3设备LPX提供。
其他云运营商理论上可以构建自己的LPQ驱动的推理服务。Groq可以通过扩展其平台以提供新的服务,如托管数据库,来与这些潜在竞争对手区分开来。其他专注于AI的云提供商,尤其是CoreWeave Holdings公司,也已将其重点从基础设施扩展到更高层次的服务。
