OpenAI推出ChatGPT代理以自动化多步骤浏览器任务

2025年07月18日 由 佚名 发表 96 0


OpenAI今天发布了一种新的人工智能代理,能够在用户的浏览器中执行复杂任务。


这个名为ChatGPT代理的功能由一个经过优化的推理AI模型驱动。OpenAI表示,该算法在多个基准测试中表现优于其早期的AI系统。


该代理旨在自动化需要用户在多个云应用中执行的任务。例如,开发人员可以指示它从GitHub下载代码文件并将其保存在Google Drive文件夹中。ChatGPT还可以在保存之前通过漏洞扫描器对文件进行检查。


ChatGPT代理使用两种不同的浏览器与在线服务交互。第一个浏览器主要用于处理文本,支持“更简单的基于推理的网页查询”。第二个浏览器允许ChatGPT代理通过图形界面与网站交互,类似于用户的操作方式。


在执行敏感操作(如购买)之前,ChatGPT会请求用户许可。此外,OpenAI要求用户在工具执行此类任务时进行积极监督。内置的控制功能允许用户停止任务、手动完成任务或为ChatGPT代理提供更新的指令。


浏览器并不是该工具可以交互的唯一应用类型。用户可以让它访问终端,这是一种可以使用脚本与计算机操作系统交互的程序。ChatGPT代理可以利用终端执行诸如编辑文件的任务。


“该模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端运行命令来操作文件,然后在可视化浏览器中查看输出结果,”OpenAI员工在博客文章中写道


ChatGPT代理由一个新的AI模型驱动,该模型在某些推理任务上优于o4-mini和o3。在一次内部测试中,OpenAI让这三个算法处理被认为是其类别中最困难的FrontierMath数学基准。ChatGPT代理的模型得分为27.4%,而o4-mini和o4分别为19.3%和10.3%。


在另一项评估中,OpenAI使用名为SpreadsheetBench的基准测试了ChatGPT代理的电子表格知识。它的得分比Excel中包含的Microsoft Copilot版本高出25%。


OpenAI为ChatGPT代理开发了一套新的防护措施,以防止黑客滥用其功能。这些安全措施特别强调阻止隐藏在网页中的恶意提示。“我们已经训练和测试了代理以识别和抵抗提示注入,此外还使用监控来快速检测和响应提示注入攻击,”OpenAI员工详细说明。


该代理今天在ChatGPT的Pro、Plus和Team级别中可用。

文章来源:https://siliconangle.com/2025/07/17/openai-rolls-chatgpt-agent-automate-multistep-browser-tasks/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消