Anthropic 正在升级其Claude Managed Agents平台。该平台于今年 4 月上线,此次新增三项功能,旨在让 AI 智能体在真实应用场景中具备更高的稳定性与自适应能力。
新功能为“ Dreaming”,该机制会复盘智能体过往的运行会话,挖掘行为规律,并在不同会话之间共享总结洞察,例如识别重复出现的错误或已验证可行的标准工作流程。
从技术层面来说, Dreaming推演以异步任务形式运行:系统读取现有记忆库,最多可调取 100 条历史会话数据,清理重复及过期无效信息,并基于这些内容重构出条理化的全新记忆库,且不会改动原始记忆数据。目前该功能支持 Claude Opus 4.7 与 Claude Sonnet 4.6 版本,计费按照标准 API 令牌定价。

成果评估:独立评估人员依据既定标准核验智能体执行结果
成果评估与多智能体编排功能已从研究预览版升级为公开测试版。开发者可通过成果评估自定义评分标准体系:即设定包含明确成功判定条件的规则文档,例如“CSV 文件需包含存有数值的价格列”。
独立评估器(评分器) 会在自身上下文窗口中,依据上述标准核验智能体的输出结果,全程不受智能体推理过程的干扰。若结果未达到规范要求,评估器会找出存在的问题短板,由智能体进行修正;默认最多可修正 3 轮,最高支持 20 次重试。
多智能体编排:协调器向专业子智能体分配任务
借助多智能体编排能力,主控智能体(协调器)可统筹管理多个专业子智能体的工作。每个子智能体都在独立线程中运行,拥有隔离的上下文、专属模型、系统提示词及专用工具,同时共享同一文件系统。协调器可并行分发任务,例如同时将代码审查、测试用例编写分配给不同智能体处理。该系统最多支持 20 个不同智能体,可同时运行25 条线程。

Dreaming目前以研究预览版开放,开发者可通过 Claude 官网的申请表单申请使用权限。成果评估、多智能体编排与记忆功能,已作为 Anthropic 托管智能体平台的一部分,推出公开测试版。
