
微软宣布推出其最新芯片Maia 200,这款芯片被公司誉为硅基工作马,旨在增强AI推理能力。
这款Maia 200芯片是继公司推出的2023年发布的Maia 100之后的又一力作,技术上已具备以更快速度和更高效率运行强大AI模型的能力。公司表示,Maia配备了超过1000亿个晶体管,提供超过10 petaflops的4位精度性能和大约5 petaflops的8位性能——相较于其前代产品有了显著提升。
推理是指运行模型的计算过程,与训练模型所需的计算不同。随着AI公司逐渐成熟,推理成本已成为其整体运营成本中越来越重要的一部分,导致对优化该过程的方式重新产生兴趣。
微软希望Maia 200能成为这种优化的一部分,使AI业务运行时中断更少且功耗更低。公司表示:“在实际应用中,一个Maia 200节点可以轻松运行当今最大的模型,并为未来更大的模型留有充足的余地。”
微软的新芯片也是科技巨头转向自设计芯片以减少对英伟达依赖的趋势的一部分,英伟达的尖端GPU已成为AI公司成功的关键。例如,谷歌有其TPU,张量处理单元——这些不是作为芯片出售,而是通过其云提供的计算能力。此外,还有亚马逊的Trainium,这家电商巨头的AI加速器芯片,其最新版本Trainium3刚于12月推出。在每种情况下,TPU都可以用于卸载一些本来分配给英伟达GPU的计算,从而降低整体硬件成本。
通过Maia,微软正定位自己以与这些替代方案竞争。在周一的新闻稿中,公司指出Maia提供的FP4性能是第三代亚马逊Trainium芯片的3倍,FP8性能超过谷歌第七代TPU。
微软表示,Maia已经在为公司超级智能团队的AI模型提供支持。它还支持Copilot聊天机器人的运营。截至周一,公司表示已邀请包括开发者、学者和前沿AI实验室在内的多方使用其Maia 200软件开发工具包进行工作负载。
