谷歌最新AI模型让机器人更智能、更有能力

2025年09月26日由佚名发表 681 0

谷歌有限责任公司的DeepMind研究部门今天宣布对其多个人工智能模型进行了重大更新，这些模型旨在提升机器人的智能水平。通过此次更新，智能机器人现在能够执行更复杂的多步骤任务，甚至可以在网上搜索信息以协助完成任务。

新发布的模型包括Gemini Robotics 1.5，它用于驱动机器人，以及Gemini Robotics-ER 1.5，这是一个帮助机器人进行思考的具身推理模型。

DeepMind最初在三月发布了这些模型，但当时它们只能执行单一任务，例如拉开拉链或折叠纸张。但现在它们可以做更多事情。例如，它们可以根据浅色和深色将洗衣篮中的衣物分开，并可以为某人打包行李，选择适合伦敦或纽约预测天气条件的衣物。DeepMind表示，对于后者任务，它们需要在网上搜索最新的天气预报。它们还可以根据所在位置的指导方针，在网上搜索信息以执行其他任务，例如在垃圾桶中分类可回收物。

在一篇博客文章中，DeepMind机器人部门负责人Carolina Parada表示，这些模型将帮助开发人员构建“更有能力和更通用的机器人”，这些机器人能够主动理解其环境。

在新闻发布会上，Parada补充说，这两个模型相互配合，使机器人在开始行动之前能够提前多步思考。她说：“到目前为止的模型能够很好地以非常通用的方式执行一条指令。通过这次更新，我们现在从一条指令转向实际的理解和解决物理任务的问题。”

Gemini Robotics 1.5和Gemini Robotics-ER 1.5被称为“视觉-语言-行动”或VLA模型，但它们被设计用来做不同的事情。前者将视觉信息和指令转化为运动指令，使机器人能够执行任务。它在采取行动之前进行思考，并展示这一思考过程，这有助于机器人以最有效的方式评估和完成复杂任务。

至于Gemini Robotics-ER 1.5，它被设计用来推理其操作的物理环境。它能够使用数字工具，如网络浏览器，然后创建详细的多步骤计划来完成特定任务或使命。一旦计划准备好，它就将其传递给Gemini Robotics 1.5来执行。

Parada表示，这些模型即使配置在不同的机器人上，也可以相互“学习”。在测试中，DeepMind发现仅分配给ALOHA2机器人的任务，该机器人有两个机械臂，后来也可以由双臂Franka机器人和Apptronik的人形机器人Apollo同样出色地完成。

“这为我们带来了两件事，”Parada说。“一是用一个模型控制非常不同的机器人，包括一个人形机器人。其次，在一个机器人上学到的技能现在可以转移到另一个机器人上。”

谷歌表示，Gemini Robotics-ER 1.5通过Gemini应用程序接口在Google AI Studio中向任何想要尝试的开发者开放，这是一个构建和微调AI模型并将其与应用程序集成的平台。开发者可以阅读这个资源以开始构建机器人AI应用程序。

Gemini Robotics 1.5更为独家，目前仅向“精选合作伙伴”开放，Parada说。

文章来源：https://siliconangle.com/2025/09/25/googles-newest-ai-models-make-robots-intelligent-capable-ever/

标签：

机器人

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Spotify将标记AI音乐，过滤垃圾信息及更多AI政策变更

下一篇谷歌的机器人现在可以思考、搜索网络并自学新技能

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体