
越来越多的浏览器正在尝试代理功能,这些功能可以代表用户执行操作,比如预订票务或购物。然而,这些代理功能也伴随着 安全风险可能导致数据或金钱的损失。
谷歌详细介绍了其在Chrome上使用观察者模型和用户操作同意来保障用户安全的方法。公司预览了Chrome上的代理功能在九月并表示这些功能将在未来几个月内推出。
公司表示,它正在使用一些模型来控制代理行为。谷歌表示,它使用Gemini构建了一个用户对齐评论家,以审查计划模型为特定任务构建的行动项目。如果评论家模型认为计划的任务不符合用户的目标,它会要求计划模型重新考虑策略。谷歌指出,评论家模型只看到提议行动的元数据,而不是实际的网页内容。

更重要的是,为了防止代理访问不允许或不可信的网站,谷歌使用了代理来源集,这限制了模型访问只读来源和可读写来源。只读来源是Gemini被允许从中获取内容的数据。例如,在购物网站上,商品列表与任务相关,但横幅广告则不相关。同样,谷歌表示,代理只被允许在页面的某些iframe上点击或输入。
“这种划分确保只有来自有限来源的数据对代理可用,并且这些数据只能传递给可写来源。这限制了跨来源数据泄漏的威胁向量。这也使浏览器能够执行一些分离,例如不将不在可读集合中的数据发送给模型,”公司在博客文章中表示。
谷歌还通过另一个观察者模型调查URL来监控页面导航。公司表示,这可以防止导航到有害的模型生成的URL。

这家搜索巨头表示,它还将敏感任务的控制权交给用户。例如,当代理尝试导航到包含银行或医疗数据等信息的敏感网站时,它会首先询问用户。对于需要登录的网站,它会询问用户是否允许Chrome使用密码管理器。谷歌表示,代理的模型没有接触到密码数据。公司补充说,在进行购买或发送消息等操作之前,它会询问用户。
谷歌表示,除此之外,它还拥有一个提示注入分类器,以防止不必要的操作,并且正在测试代理功能以抵御研究人员创建的攻击。
