谷歌刚刚推出了一系列AI代理,旨在处理长期以来消耗数据团队大量时间的繁重工作。公司宣布了六种新的“代理”工具,这些工具可以自动构建数据管道、调试代码,甚至在无需编写一行SQL的情况下回答复杂的商业问题。
在Google Cloud Next东京大会上,公司推出了一整套AI代理工具,旨在让数据工程师、科学家、分析师和开发人员的工作更加轻松。
谷歌表示,这一切都是新代理企业的一部分,数据不应只是等待人们查询。相反,智能代理应该在你所在的位置与你会面,理解你的需求,并为你完成大部分繁重工作。
从BigQuery开始。谷歌推出了一个数据工程代理可以从简单的提示构建完整的数据管道。只需给出类似“清理这个CSV,将其与销售数据合并,并推送到BigQuery”这样的指令,它就会处理好一切。对于更高级的工作流程,数据科学代理在BigQuery Notebooks中可以进行端到端的模型构建,包含可视化和推理。
对于分析师和业务团队,谷歌的对话式分析代理进行了重大升级:现在包括一个运行Python的代码解释器。这意味着你可以提出复杂的问题,比如“按Q2的行为对客户进行细分”,它会提供代码、图表和见解——所有这些都在企业的安全数据堆栈中。
开发者也没有被遗忘。谷歌推出了Gemini CLI GitHub Actions,一个开源的AI代理,驻留在你的代码库中。它可以分类问题、审查拉取请求,甚至可以通过@提及来处理特定任务。它在后台运行,并与包括谷歌云的安全工作负载身份联合在内的技术栈兼容。
真正的强力举措是基础设施。BigQuery现在配备了一个AI查询引擎,因此你可以在SQL中运行类似LLM的查询。它还支持混合语义搜索、向量嵌入生成,以及一个新的Spanner列式引擎,将OLTP和OLAP的距离拉得更近。
谷歌还使这些工具能够处理非结构化数据——图像、音频、视频——而不仅仅是传统数据库。新的Spanner列式引擎可以将分析查询速度提高到200倍,而BigQuery获得了多模态表,可以一起存储和查询不同的数据类型。
公司并未止步于此。它正在推出API,以便开发者可以将这些对话式分析功能嵌入到他们自己的应用程序中,并且它正在采用开放标准,如模型上下文协议,以便与其他AI工具兼容。
这些代理现在正在推出,大多数功能在现有的BigQuery和Looker定价中无需额外收费即可使用。