xAI的Grok 4 Fast以极低成本提供顶级AI性能

2025年09月22日 由 佚名 发表 32 0

xAI发布了Grok 4 Fast,这是一款新模型,大幅降低了获取高端人工智能的成本。正如其名,Grok 4 Fast比其他模型更快、更便宜,同时在解决复杂问题时所需的令牌更少。

独立评测显示,该模型的智能水平可与谷歌的Gemini 2.5 Pro媲美,但价格却低约25倍。


随着最先进模型的价格不断下降和前沿AI的商品化,开发者有越来越多的选择来构建强大的AI应用。


效率方程



该模型的主要优势在于其高性价比的智能。这是由于较低的令牌定价和优越的令牌效率。根据xAI,Grok 4 Fast平均使用40%更少的“思考令牌”来解决问题,比其前身Grok 4更高效。由于推理任务可能生成数万个令牌,这种效率可以显著降低应用的成本。


这种效率结合新的定价,使得实现与前一模型相同性能的成本降低了98%。该模型还具有200万令牌的上下文窗口,允许其处理和分析大量文档和复杂提示。相比之下,Gemini 2.5目前支持100万令牌,GPT-5有40万令牌的上下文窗口,而Claude Opus 4.1支持12.8万令牌。更长的上下文窗口对于需要多个文档和大型代码库的应用尤其重要。


该模型的效率在外部基准测试中得到了证实。为了完成人工分析智能指数,Grok 4 Fast使用了6100万令牌。这显著少于Gemini 2.5 Pro使用的9300万令牌,几乎是完整Grok 4模型完成相同任务所需的1.2亿令牌的一半。


我们对Grok 4 Fast架构的了解


不幸的是,目前没有关于Grok 4架构的信息(希望xAI在发布Grok 6时能开源,就像他们对Grok 2所做的那样)。但根据xAI的博客,Grok 4 Fast引入了“一个统一的架构,其中推理(长链思维)和非推理(快速响应)由相同的模型权重处理,通过系统提示进行引导。”据xAI称,这种设计减少了延迟和令牌成本,使该模型适合需要在不同计算深度之间切换的实时应用。


这与一些模型采用的方法类似,如Anthropic Claude 3.7及其后续版本,使用特殊令牌来激活模型的推理机制。另一种方法是OpenAI GPT-5采用的“路由器”方法,根据提示是否需要链式思维(CoT)推理来引导提示到模型的不同版本。


博客中提到的训练还有一些其他有趣的方面。首先,令牌效率是通过优化的强化学习(RL)过程实现的。RL已成为训练大型推理模型的重要部分。一种方法是DeepSeek-R1-Zero使用的,在RL阶段对模型不设限制,仅根据最终答案评估其响应。然而,这可能导致模型过度思考并探索不合逻辑的路径。一种更先进的方法(可能也用于Grok 4 Fast)是逐步添加额外的奖励信号,如响应长度,以激励模型不仅获得正确答案,还优化其推理链。


该模型的另一个有趣方面是Grok 4 Fast通过“工具使用强化学习”进行端到端训练,这提高了其决定何时使用外部工具(如网页浏览或代码执行)的能力。这一点尤为重要,原因有几个。首先,工具使用是代理应用的基石。其次,通过RL进行工具使用使模型能够学习新的工具使用方式,而无需人工标注数据。


Grok 4 Fast的性能和应用


在推理基准测试中,Grok 4 Fast在人工分析智能指数中得分60,位于Gemini 2.5 Pro和Claude 4.1 Opus同一性能层。它在编码评估中表现尤为出色,位居LiveCodeBench排行榜首位,超越了更大的Grok 4。在LMArena平台的公开评估中,该模型在搜索竞技场中排名第一,在文本竞技场中排名第八,与完整的Grok 4表现相当。预发布API基准测试记录的输出速度为每秒344个令牌,约为OpenAI的GPT-5 API的2.5倍。


该模型的主要应用之一是代理搜索。它可以浏览网页和X,处理包括文本、图像和视频在内的实时数据以综合答案。特别是,与X数据的集成可以在需要从社交网络上获取实时信息的研究任务中为其提供巨大优势。(社交媒体的集成也很棘手,因为xAI团队需要找出哪些信号表明哪些帖子包含相关信息,哪些是过时或误导的。例如,最近在X上有一种趋势,高粉丝数的用户发布旧的AI研究论文并将其呈现为科学突破。)


先进AI的商品化



Grok 4 Fast现已在grok.com及其移动应用上向所有用户开放,包括免费用户。对于开发者,该模型通过xAI API以两个端点提供:grok-4-fast-reasoning和grok-4-fast-non-reasoning。定价为每百万输入令牌0.20美元,每百万输出令牌0.50美元,适用于128,000令牌以下的上下文。对于超过128,000令牌的上下文,价格为每百万输入/输出令牌0.50美元和1.00美元。这比GPT-5、Gemini 2.5 Pro和Claude 4系列便宜得多,为开发者提供了一个强大的工具,以极低的价格构建应用。




文章来源:https://bdtechtalks.com/2025/09/22/xai-grok-4-fast/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消