在家中构建复杂的机器人项目变得稍微容易了一些。
本周早些时候,AI开发平台Hugging Face发布了一个名为SmolVLA的开放AI机器人模型。Hugging Face声称,SmolVLA在虚拟和现实环境中都优于更大的机器人模型,它是基于“兼容许可”的社区共享数据集训练的。
“SmolVLA旨在让视觉-语言-动作(VLA)模型的使用更加普及,并加速通用机器人代理的研究,”Hugging Face在博客文章中写道。“SmolVLA不仅是一个轻量级但功能强大的模型,还是一种训练和评估通用机器人技术的方法。”
SmolVLA是Hugging Face迅速扩展的低成本机器人硬件和软件生态系统的一部分。去年,该公司推出了LeRobot,一个专注于机器人的模型、数据集和工具的集合。最近,Hugging Face收购了Pollen Robotics,一家位于法国的机器人初创公司,并推出了几款低价机器人系统,包括人形机器人,供购买。
SmolVLA拥有4.5亿个参数,是在LeRobot社区数据集上训练的,这些数据集是Hugging Face的AI开发平台上特别标记的机器人数据集。参数,有时被称为“权重”,是指导模型行为的内部组件。
Hugging Face声称,SmolVLA小到可以在单个消费者级GPU甚至MacBook上运行,并且可以在“经济实惠”的硬件上进行测试和部署,包括公司的机器人系统。
有趣的是,SmolVLA还支持“异步推理堆栈”,Hugging Face表示这使得模型可以将机器人的动作处理与其看到和听到的内容处理分开。正如公司在其博客文章中解释的那样,“由于这种分离,机器人可以在快速变化的环境中更快地响应。”
SmolVLA可以从Hugging Face下载。
值得注意的是,Hugging Face远不是新兴开放机器人竞赛中的唯一参与者。
Nvidia拥有一套开放机器人工具,而初创公司K-Scale Labs正在构建其所谓的“开源人形机器人”的组件。该领域的其他强大公司包括Dyna Robotics、由杰夫·贝索斯支持的Physical Intelligence和RLWRLD。