
OpenAI Group PBC 今天推出了 Aardvark,这是一种由 GPT-5 驱动的新型自主人工智能代理,旨在实时识别、验证和帮助修复软件漏洞。
OpenAI 将 Aardvark 描述为代表“人工智能和安全研究的突破”,被描述为“人工智能安全研究人员”,能够扫描代码存储库、推理潜在漏洞,甚至生成经过验证的补丁。这个想法是为防御者提供一个智能盟友,可以跟上现代软件开发的速度和规模。
Aardvark 直接与 GitHub 等平台集成,并支持开源和企业环境。
该代理的工作原理是分析整个存储库以构建上下文威胁模型,然后再扫描每个新代码提交以查找漏洞。一旦检测到问题,Aardvark 会自动尝试在沙盒中重现该漏洞以确认其真实性,然后使用 OpenAI 的 Codex 引擎提出修复建议。
为确保人类仍在发挥作用,该系统提供报告和建议的补丁供人工审查,而不是自主进行未经验证的更改。
据 OpenAI 称,早期结果令人鼓舞,Aardvark 在内部测试期间识别了基准存储库中大约 92% 的已知漏洞和合成漏洞。在有限的试验中,该代理还发现了开源项目中的实际问题,其中一些项目已被分配了官方的常见漏洞和暴露编号。
OpenAI 并不以开发网络安全工具而闻名。该公司表示,Aardvark 是“回馈社会”新承诺的一部分,通过贡献工具和发现,使数字生态系统对每个人来说都更安全。作为该承诺的一部分,Aardvark 将获得无偿扫描,以选择非商业性开源存储库,为开源软件生态系统和供应链的安全做出贡献。
Aardvark 目前正在进行私人 Beta 测试,以验证和完善其在该领域的能力。OpenAI 尚未提供新的“人工智能安全研究员”何时全面上市的时间表。
