
谷歌推出了基于其Gemini 3.1 Pro型号的两款新型自主研究代理:Deep Research和Deep Research Max。
这两个代理现已通过Gemini API的付费层级公开预览,面向希望自动化繁重研究工作的开发者。一次API调用即可启动完整的研究工作流,代理首次能够同时从开放网络和专有数据流中提取数据,提供完全来源的分析。
不同工作量有两种模式
标准的Deep Research代理取代了谷歌去年12月发布的预览版,承诺带来更高质量、更低延迟和更低成本。它专为速度最关键的情况设计,比如聊天界面,用户期望即时回复。
《深度研究极限》则相反,优先考虑深度而非速度。智能体使用延长的测试时间计算来推理、搜索和迭代最终报告。谷歌将异步后台工作流程视为理想的用例,比如一个夜间的cron项目,能在早晨将完整的尽职调查报告送到分析团队的桌面上。
谷歌推出了基于其Gemini 3.1 Pro型号的两款新型自主研究代理:Deep Research和Deep Research Max。
这两个代理现已通过Gemini API的付费层级公开预览,面向希望自动化繁重研究工作的开发者。一次API调用即可启动完整的研究工作流,代理首次能够同时从开放网络和专有数据流中提取数据,提供完全来源的分析。
不同工作量有两种模式
标准的Deep Research代理取代了谷歌去年12月发布的预览版,承诺带来更高质量、更低延迟和更低成本。它专为速度最关键的情况设计,比如聊天界面,用户期望即时回复。
《深度研究极限》则相反,优先考虑深度而非速度。智能体使用延长的测试时间计算来推理、搜索和迭代最终报告。谷歌将异步后台工作流程视为理想的用例,比如一个夜间的cron项目,能在早晨将完整的尽职调查报告送到分析团队的桌面上。

与OpenAI的GPT-5.4和Anthropic的Opus 4.6的比较并不完全一致。GPT-5.4在自主网络搜索方面表现出色,但并不适合深度研究。为此,OpenAI 发布了自己的灾难恢复代理,但在二月更新后转用了 GPT-5.2,而不是 GPT-5.4。OpenAI最强的搜索模型实际上是GPT-5.4 Pro,谷歌显然未将其纳入比较。根据OpenAI的数据,GPT-5.4 Pro在代理搜索基准BrowseComp中达到了89.3%,而GPT-5.4则达到82.7%。
Anthropic还报告了Opus 4.6的BrowseComp数据,具体为84%。Anthropic表示,该模型在关闭推理时达到了这个分数,因为这样表现实际上比谷歌API基准测试中使用的高推理强度时更好。
差距很可能源于测试方法,模型是通过原始API评估,还是用各实验室自有工具包装。谷歌的数据不一定错误,但值得谨慎阅读。无论哪种情况,这种呈现方式都不透明。
MCP 支持使代理能够访问专有数据
其中一个较大的变化是对模型上下文协议(MCP)的支持。开发者可以将Deep Research接入自己的数据源和专业数据源,如金融或市场数据提供商。谷歌表示,通过接受任何工具定义,代理就从纯粹的网络搜索者转变为能够查询专业数据库的完全自主代理。
Gemini API 首次让该代理能够直接在报告内生成原生图表和信息图,这些图表可以 HTML 或“纳米香蕉”格式呈现,使复杂数据可视化更为便捷。
其他新增功能包括协作规划,允许用户在运行前审查和调整代理的搜索计划;多模态输入PDF、CSV、图片、音频和视频;以及中间步骤的实时流媒体。开发者也可以完全关闭网页访问,并限制代理仅能访问自己的数据。
谷歌表示,这些代理运行在支持其消费品研究功能的同一基础设施上,包括Gemini应用、NotebookLM、谷歌搜索和谷歌财经。开发者可以通过交互API开始构建自定义搜索流程,这两款代理也将很快通过Google Cloud向初创企业和企业客户推广。
