
人工智能初创公司通才AI公司是一家专注于具身机器人智能的初创公司,现已推出了GEN-1,这是一个具备高度能力的基础模型,专为机器人学习和掌握物理任务而设计。
这一新模型于周五首次亮相,仅在公司推出GEN-0五个月后。GEN-0是一种新的机器人基础模型类别,允许公司通过直接训练原始运动数据来训练AI模型。
据公司称,GEN-1在机器人智能方面实现了重大突破。它能够让机器快速掌握任务,从互动中学习,快速反应,并以空前的速度克服挑战。在多项任务中,其成功率超过99%。它执行任务的速度几乎是当前最先进模型的三倍,并且能更快地从中断中恢复。
研究人员表示,他们致力于改进三个核心领域:可靠性、速度和即兴能力。
尽管大多数模型已经能够在现实世界中可靠地重复任务,但它们局限于特定任务的重复动作,并通过采取更简单的动作来降低复杂性。GEN-1旨在管理更长的逐步任务,例如组装物品、折叠多件衣物以及其他需要复杂时空推理的任务,而不会感到困惑。
速度通常也是机器人技术的一个问题,当视野中有太多物体或移动过快时,速度往往会减慢。大多数模型的问题在于无法足够快地将所见传递给推理引擎,将视觉转化为语言再到训练数据。这通常会减慢动作,导致间隙和卡顿。如上所述,团队实现了几乎三倍的速度提升,带来了更流畅的动作。
例如,该模型可以在大约12.1秒内组装一个盒子,公司表示这比行业中最先进的模型快约2.8倍。GEN-0和pi-0,另一个知名的机器人智能模型来自物理智能,组装相同的盒子需要34秒。
这两项创新结合成第三个结果,也是最重要的:从中断中恢复的能力,学习环境变化、错误和变化。用人类的话来说,这就是即兴能力。
当某件事情不完全合理时,比如一个零件从孔中弹出,一个盒子没有对准或一个门没有锁上,人类通常会回去完成动作。AI可能会有多种不同的反应,包括强制重新评估、模式中断或未能完成任务。它甚至可能不记得如何对同一事件做出反应。人类会记得。
研究人员表示,GEN-1可以通过快速适应环境中的“故障”来创造性地应对这些因素,例如物体滑动、锁扣失效、物品变形或事情不按计划进行。它会从不同的角度接近事物,调整思维并尝试不同的模式,直到某种方法奏效。
一个经典的例子可能是折叠衬衫。让布料完全按照你的意愿去是并不总是容易的——它可能会翻动、卷曲、变形和起皱。有时衬衫甚至会翻到里面。当这些情况出现时,AI会迅速适应以解决混乱,并在不制造更大问题的情况下处理它。
研究人员表示,该模型计划并围绕其训练进行工作,其方式比其训练数据更不僵化。用更人性化的话来说:它跳出框框思考。
尽管通才的研究人员对GEN-1赞不绝口,但他们补充说,并非所有任务都能达到99%的成功率。一些复杂任务无法达到这一雄心勃勃的标准,尤其是在合理的速度和可靠性下,以便在日常环境中有用。
