
谷歌公司推出了两款全新的开源工具,旨在简化人工智能环境中的操作任务。
这些工具在今天于亚特兰大举行的KubeCon + CloudNativeCon北美大会上首次亮相,并与谷歌云的GKE托管Kubernetes服务中的新功能GKE Pod Snapshots一同发布。
AI代理通过使用外部应用程序,如浏览器和数据库,来执行任务。这种集成可能会带来网络安全风险:AI代理可能会利用代码编辑器编写恶意软件。开发人员通过将代理及其使用的应用程序部署在与敏感系统隔离的容器或沙箱中,来降低网络安全风险。
谷歌今天推出的第一个开源工具,Agent Sandbox,旨在简化AI代理沙箱的创建。它作为Kubernetes核心功能集的扩展实现。据这家科技巨头称,AI应用程序可以使用Agent Sandbox启动数千个隔离的AI代理环境,并在代理完成工作后将其删除。
Agent Sandbox基于一个名为gVisor的开源工具。谷歌在2018年发布的这项技术将容器与其运行的操作系统的敏感组件隔离开来,从而防止任何可能在容器内运行的AI编写的恶意软件进行恶意更改。
谷歌云将在其GKE服务中提供对Agent Sandbox的支持,该服务使开发人员能够创建基于云的Kubernetes集群,并自动化许多相关的基础设施维护任务。
据谷歌称,GKE现在使开发人员能够创建“预热”的Agent Sandbox环境。这些环境是包含AI代理执行任务所需工具的容器,并在工作开始前上线。提前启动沙箱消除了代理在这些沙箱初始化时暂停工作的需要,从而加快了处理速度。
谷歌云承诺通过今天也首次亮相的GKE功能Pod Snapshots进一步提高AI工作负载的性能。一些大型语言模型的启动时间可能超过10分钟。据谷歌称,Pod Snapshots在某些情况下将启动时间缩短了80%。
LLM启动时间长的主要原因之一是它们运行的容器必须从头开始初始化。这个任务涉及部署模型运行所需的各种软件组件,然后配置这些组件。这个过程通常由脚本自动执行。
Pod Snapshots通过消除脚本驱动的环境配置需求来加快工作流程。该功能创建了一个容器的快照或副本,其中不仅包括它包含的所有软件组件,还包括它们的配置。应用程序可以简单地从内存中加载现成的快照,而不是使用脚本单独设置软件组件。
“GKE Pod Snapshots支持CPU和GPU工作负载的快照和恢复,将pod启动时间从几分钟缩短到几秒钟,”谷歌高级产品经理Brandon Royal在博客文章中写道。“使用Pod Snapshots,任何空闲的沙箱都可以被快照和暂停,从而在不对终端用户造成干扰的情况下节省大量计算周期。”
谷歌正在推出Agent Sandbox和Pod Snapshots以及一个名为Multi-Tier Checkpointing(MTC)的新开源工具。它旨在简化大规模AI训练项目。
AI模型在训练过程中有时会遇到错误,必须在项目继续之前进行修复。消除错误的最简单方法是从头开始重新启动训练会话。然而,这需要大量时间。开发人员通过在训练过程中偶尔保存LLM并在出现错误时恢复最近版本来缩短过程。
