谷歌DeepMind发布AI编码代理AlphaEvolve

2025年05月28日 由 佚名 发表 84 0

谷歌DeepMind发表了一篇描述他们的AlphaEvolve编码代理的论文。AlphaEvolve利用大型语言模型(LLM)在多个领域中发现和优化算法,包括硬件设计、数据中心运营和AI训练。

AlphaEvolve使用了一组LLM,包括Gemini Flash和Gemini Pro,来生成和进化解决用户定义问题的程序。具体来说,用户需要指定一个返回一组标量指标的评估函数。谷歌已将AlphaEvolve应用于数学、工程和计算机科学中的多个问题,并取得了良好效果。其中一个例子是AlphaEvolve发现了一种更高效的4x4矩阵乘法算法。谷歌还将其应用于超过50个数学问题;AlphaEvolve重新发现了75%的问题的最先进解决方案,并为其中20%找到了更优的解决方案。根据谷歌的说法,

虽然AlphaEvolve目前主要应用于数学和计算领域,但其通用性质意味着它可以应用于任何可以描述为算法并自动验证的解决方案的问题。我们相信AlphaEvolve可以在材料科学、药物发现、可持续发展以及更广泛的技术和商业应用中带来变革。

AlphaEvolve的核心理念是使用LLM生成和进化代码。系统维护一个由其生成的候选程序组成的数据库,并将其作为上下文输入到LLM中,连同描述如何进化程序的提示。生成的程序如果在评估中表现良好,就会存储在数据库中,这个循环会持续进行,直到找到最佳解决方案。

AlphaEvolve Architecture

除了解决数学问题,谷歌还使用AlphaEvolve改进了其自身的数据中心运营。它开发了一种新的启发式函数,用于谷歌的Borg任务编排器。AlphaEvolve的解决方案优于深度强化学习发现的方案,谷歌因此能够恢复其全球0.7%的计算资源。AlphaEvolve还改进了其AI训练过程中的内核平铺和FlashAttention操作,分别提高了23%和32%的速度。

在Hacker News的讨论中,用户普遍对AlphaEvolve持积极态度并提到了谷歌最近的AI成就:

人们常常忘记谷歌是Mu Zero的幕后推手,我认为这是十年来最重要的AI论文,而不是Transformer,因为他们有效地展示了模型如何学习搜索。

在X上撰文,牛津大学的AI研究员Simon Frieder批评了DeepMind没有完全开源其代码的做法:

DeepMind,尽管他们确保所有发布的内容在科学上都很有趣,但在发布完整公共代码方面有些不稳定。例如,AlphaFold2发布了,但没有训练脚本。AlphaGeometry被发现包含错误。在这两种情况下,开源替代品被开发出来:OpenFold在第一种情况下,Newclid在第二种情况下……由于这种历史,AlphaEvolve中可能包含隐藏的错误,这让我不太信任它给出的结果。在某些情况下,可能很容易验证其输出结果是正确的,但并非在所有情况下都如此。请注意,这与LLM幻觉不同,因为这里我们有一个AlphaEvolve依赖的自动评估器。

虽然该模型尚未公开,但学术研究人员可以申请提前访问AlphaEvolve。

文章来源:https://www.infoq.com/news/2025/05/google-alpha-evolve/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消