OpenAI推出ChatGPT代理以自动化多步骤浏览器任务

2025年07月18日由佚名发表 731 0

OpenAI今天发布了一种新的人工智能代理，能够在用户的浏览器中执行复杂任务。

这个名为ChatGPT代理的功能由一个经过优化的推理AI模型驱动。OpenAI表示，该算法在多个基准测试中表现优于其早期的AI系统。

该代理旨在自动化需要用户在多个云应用中执行的任务。例如，开发人员可以指示它从GitHub下载代码文件并将其保存在Google Drive文件夹中。ChatGPT还可以在保存之前通过漏洞扫描器对文件进行检查。

ChatGPT代理使用两种不同的浏览器与在线服务交互。第一个浏览器主要用于处理文本，支持“更简单的基于推理的网页查询”。第二个浏览器允许ChatGPT代理通过图形界面与网站交互，类似于用户的操作方式。

在执行敏感操作（如购买）之前，ChatGPT会请求用户许可。此外，OpenAI要求用户在工具执行此类任务时进行积极监督。内置的控制功能允许用户停止任务、手动完成任务或为ChatGPT代理提供更新的指令。

浏览器并不是该工具可以交互的唯一应用类型。用户可以让它访问终端，这是一种可以使用脚本与计算机操作系统交互的程序。ChatGPT代理可以利用终端执行诸如编辑文件的任务。

“该模型可以选择使用文本浏览器或可视化浏览器打开页面，从网络下载文件，通过在终端运行命令来操作文件，然后在可视化浏览器中查看输出结果，”OpenAI员工在博客文章中写道。

ChatGPT代理由一个新的AI模型驱动，该模型在某些推理任务上优于o4-mini和o3。在一次内部测试中，OpenAI让这三个算法处理被认为是其类别中最困难的FrontierMath数学基准。ChatGPT代理的模型得分为27.4%，而o4-mini和o4分别为19.3%和10.3%。

在另一项评估中，OpenAI使用名为SpreadsheetBench的基准测试了ChatGPT代理的电子表格知识。它的得分比Excel中包含的Microsoft Copilot版本高出25%。

OpenAI为ChatGPT代理开发了一套新的防护措施，以防止黑客滥用其功能。这些安全措施特别强调阻止隐藏在网页中的恶意提示。“我们已经训练和测试了代理以识别和抵抗提示注入，此外还使用监控来快速检测和响应提示注入攻击，”OpenAI员工详细说明。

该代理今天在ChatGPT的Pro、Plus和Team级别中可用。

文章来源：https://siliconangle.com/2025/07/17/openai-rolls-chatgpt-agent-automate-multistep-browser-tasks/

标签：

OpenAI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI的ChatGPT代理大幅减少点击量，能在“自己的电脑”上执行任务

下一篇 Anthropic在未通知用户的情况下收紧了Claude Code的使用限制

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体

Grok 4.5登场：编码与长程智能体再升级

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

OpenAI首款推理芯片亮相，年底开始部署

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

OpenAI GPT-Live：实时语音模型再升级