
Moonshot AI,由阿里巴巴和红杉中国(前身为红杉资本中国)等支持,今日发布了全新开源模型Kimi K2.5,该模型具备理解文本、图像和视频的能力。
公司表示,该模型在15万亿混合视觉和文本标记上进行了训练,因此具备多模态特性。公司补充说,这些模型在编码任务和处理代理群体方面表现出色。
——这是一种多代理协同工作的编排。在发布的基准测试中,该模型的表现与专有模型相当,甚至在某些任务中超越了它们。
例如,在编码基准测试中,Kimi K2.5在SWE-Bench验证基准测试中表现优于Gemini 3 Pro,并在SWE-Bench多语言基准测试中得分高于GPT 5.2和Gemini 3 Pro。在视频理解方面,它在VideoMMMU(视频大规模多学科多模态理解)基准测试中击败了GPT 5.2和Claude Opus 4.5,该基准测试衡量模型对视频的推理能力。

Moonshot AI表示,在编码方面,虽然该模型能够很好地理解文本,但用户也可以输入图像或视频,并要求其生成与这些媒体文件中显示的界面相似的内容。
为了让人们使用这些编码功能,公司推出了一个名为Kimi Code的开源编码工具,这将与Anthropic的Claude Code或谷歌的Gemini CLI竞争。开发者可以通过他们的终端使用Kimi Code,或将其与VSCode、Cursor和Zed等开发软件集成。初创公司表示,开发者可以使用图像和视频作为Kimi Code的输入。
编码工具迅速流行起来,成为AI实验室的收入驱动因素。Anthropic在11月宣布,Claude Code的年化经常性收入(ARR)已达到10亿美元。本月早些时候,《连线》报道称,到2025年底,该工具已在此基础上增加了1亿美元。根据《信息》的报道,Moonshot的中国竞争对手Deepseek计划下个月发布一个具有强大编码能力的新模型。
Moonshot由前谷歌和Meta AI研究员杨志林创立。公司在B轮融资中筹集了10亿美元,估值为25亿美元。根据彭博社的报道,该初创公司上个月获得了5亿美元的融资,估值为43亿美元。此外,报道指出,它已经在寻求以50亿美元的估值进行新一轮融资。
