谷歌最新AI模型让机器人更智能、更有能力

2025年09月26日 由 佚名 发表 85 0


谷歌有限责任公司的DeepMind研究部门今天宣布对其多个人工智能模型进行了重大更新,这些模型旨在提升机器人的智能水平。通过此次更新,智能机器人现在能够执行更复杂的多步骤任务,甚至可以在网上搜索信息以协助完成任务。


新发布的模型包括Gemini Robotics 1.5,它用于驱动机器人,以及Gemini Robotics-ER 1.5,这是一个帮助机器人进行思考的具身推理模型。


DeepMind最初在三月发布了这些模型,但当时它们只能执行单一任务,例如拉开拉链或折叠纸张。但现在它们可以做更多事情。例如,它们可以根据浅色和深色将洗衣篮中的衣物分开,并可以为某人打包行李,选择适合伦敦或纽约预测天气条件的衣物。DeepMind表示,对于后者任务,它们需要在网上搜索最新的天气预报。它们还可以根据所在位置的指导方针,在网上搜索信息以执行其他任务,例如在垃圾桶中分类可回收物。


在一篇博客文章中,DeepMind机器人部门负责人Carolina Parada表示,这些模型将帮助开发人员构建“更有能力和更通用的机器人”,这些机器人能够主动理解其环境。


在新闻发布会上,Parada补充说,这两个模型相互配合,使机器人在开始行动之前能够提前多步思考。她说:“到目前为止的模型能够很好地以非常通用的方式执行一条指令。通过这次更新,我们现在从一条指令转向实际的理解和解决物理任务的问题。”


Gemini Robotics 1.5和Gemini Robotics-ER 1.5被称为“视觉-语言-行动”或VLA模型,但它们被设计用来做不同的事情。前者将视觉信息和指令转化为运动指令,使机器人能够执行任务。它在采取行动之前进行思考,并展示这一思考过程,这有助于机器人以最有效的方式评估和完成复杂任务。


至于Gemini Robotics-ER 1.5,它被设计用来推理其操作的物理环境。它能够使用数字工具,如网络浏览器,然后创建详细的多步骤计划来完成特定任务或使命。一旦计划准备好,它就将其传递给Gemini Robotics 1.5来执行。


Parada表示,这些模型即使配置在不同的机器人上,也可以相互“学习”。在测试中,DeepMind发现仅分配给ALOHA2机器人的任务,该机器人有两个机械臂,后来也可以由双臂Franka机器人和Apptronik的人形机器人Apollo同样出色地完成。


“这为我们带来了两件事,”Parada说。“一是用一个模型控制非常不同的机器人,包括一个人形机器人。其次,在一个机器人上学到的技能现在可以转移到另一个机器人上。”


谷歌表示,Gemini Robotics-ER 1.5通过Gemini应用程序接口在Google AI Studio中向任何想要尝试的开发者开放,这是一个构建和微调AI模型并将其与应用程序集成的平台。开发者可以阅读这个资源以开始构建机器人AI应用程序。


Gemini Robotics 1.5更为独家,目前仅向“精选合作伙伴”开放,Parada说。


文章来源:https://siliconangle.com/2025/09/25/googles-newest-ai-models-make-robots-intelligent-capable-ever/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消