
OpenAI集团PBC今日宣布推出一款名为Frontier的平台,企业可以利用它来构建和管理人工智能代理。
这一产品与公司最新版本的编程优化模型同时发布。被称为GPT-5.3-Codex的算法不仅在代码生成方面优于其前身,还在一般生产力任务上表现更佳。
Frontier允许员工在类似于ChatGPT的聊天框中创建AI代理。首先,用户需要输入自然语言描述,说明代理应执行的任务及其方式。接着,员工可以将代理与用于自动化手动工作的应用程序集成。OpenAI表示,Frontier可以连接到客户关系管理平台、数据仓库和其他多种服务。
员工可以选择为代理添加技能。这些技能是用户创建的扩展,使OpenAI驱动的代理在执行多步骤任务时表现更佳。例如,技能可以包括预设的Kubernetes配置脚本,代理可以使用这些脚本来创建容器集群。
OpenAI表示,连接到Frontier的代理会“建立记忆”以记录其执行的任务。这些记忆使它们能够随着时间的推移提高输出质量。根据公司说法,管理员可以在仪表板中监控代理的性能,该仪表板可视化显示诸如处理的客户支持票数量及其成功率等指标。
Frontier还包括其他可观测性功能。该平台为代理完成的每个任务创建了审计日志,以便于质量评估。例如,技术支持互动的审计日志可能包括量化代理礼貌性和输出准确性的可视化。
OpenAI计划为客户提供所谓的前置部署工程师,帮助他们开发Frontier最佳实践。此外,它将与其他AI公司合作,帮助他们构建基于Frontier的功能。初始合作伙伴名单包括销售自动化提供商Clay Labs Inc.、医疗笔记专家Ambience Healthcare Inc.及其他几家初创公司。
OpenAI今天与Frontier一起推出的以编码为重点的模型GPT-5.3-Codex,其响应速度比前代快25%。该算法在SWE-Bench Pro和Terminal-Bench编程基准测试中创下新纪录。前者测试包括跨四种编程语言的编码问题,而后者评估AI模型使用命令行的能力。
OpenAI表示,GPT-5.3-Codex也适用于一系列其他用例。公司使用名为OSWorld的基准测试评估了该模型,该测试包括大量在线研究和文件编辑任务。GPT-5.3-Codex得分为64.7%,比其前身高出26.5%。
该模型在ChatGPT的付费版本中可用,并将很快推出OpenAI的应用程序编程接口。同时,Frontier对包括Oracle公司、惠普公司及其他几家大型科技公司在内的有限企业客户开放。OpenAI计划在未来几个月内更广泛地提供该平台。
