纽约大学的数据科学家发现了一项有趣的研究,解码了AI模型从婴儿可爱咿呀学语中汲取洞察力的能力。尽管人类长期以来因其在语言习得方面的特殊能力而受到认可,但这项研究证明了AI也能从有限的数据集中学习的观念。
“我们确实进行了这项实验。我们训练了一个神经网络(我们称之为CVCL,它与CLIP通过对比目标的使用相关),利用头戴式摄像头拍摄的视频,记录了从6个月到25个月大期间,孩子看到和听到的一切。
这是一次前所未有的观察一个孩子的经历的机会,但数据仍然有限:仅61小时(转录后)的视频,约占其清醒时间的1%,”《通过单个孩子的眼睛和耳朵进行基础语言习得》研究的研究员之一Wai Keen Vong说。
这与Meta AI首席Yann LeCun的自主机器智能理念相似。这位图灵奖得主长期以来一直认为,教AI系统像孩子一样观察可能是通往更智能系统的道路。他预测,他的“世界模型”类似于人类大脑的工作方式,可能是AI系统实现智能化的理想途径。
从孩子的经历中学习
尽管这项研究使用的数据有限,但它表明,AI模型可以通过数十到数百个示例有效地学习词汇与参照物的关联。它能够无缝地泛化到新的视觉数据集,并展示实现多模态对齐的能力。
“我们的发现解决了哲学和认知科学中长期存在的经典争论:孩子们学习词汇需要哪些要素?考虑到他们的日常经验,他们(或任何学习者)是否需要特定的语言归纳偏见或先天知识来开始学习?还是联合表示和联想记忆就足够了?我们的研究表明,仅仅通过学习,我们就能获得比通常认为的更多的东西,”Vong补充道。
尽管取得了进步,但目前的模型——用于对比学习的儿童视角(CVCL),在词汇量和词汇学习能力方面仍无法与典型的2岁孩子相提并论。
造成这种差距的因素有很多,包括CVCL缺乏味觉、触觉和嗅觉等感官体验,其被动学习方法与孩子主动参与的学习方式相比有所不足,以及缺乏社会认知能力。
与孩子们不同,CVCL无法感知欲望、目标或社交线索,也不理解语言是实现愿望的一种手段。
儿童游戏:通往更智能系统的道路
观察儿童在推动人工智能对物理世界的理解方面已证明具有无可估量的价值。谷歌DeepMind的研究人员证实,发展心理学家通过研究婴儿对物理学的先天知识,已经确定了关键的物理概念。他们设计了诸如违反期望范式等方法来测量这些概念。
受发展心理学的启发,该团队创建了PLATO(通过自动编码和跟踪对象学习物理)。该模型将世界表示为不断演变的对象,并根据它们的相互作用进行预测。
在对PLATO进行简单物理交互训练时,发现它超越了其他缺乏基于对象的表示的模型,这表明该框架在直观物理学学习中的重要性。
PLATO展示了仅用28小时视觉经验就能学习的能力,并且可以无需重新训练就能泛化到新刺激。这项工作强调了儿童发展研究在开发能够理解和应对物理世界复杂性的AI系统方面的潜力。
AI也能帮助孩子!
加州大学洛杉矶分校的研究人员又取得了一项突破性创新,他们开发了一款新的AI应用程序——Chatterbaby,该程序能够解读婴儿的哭声,并提供关于婴儿试图传达的信息的见解。
阿里安娜·安德森博士和她的团队上传了2000个婴儿哭声的音频样本,这些样本能够以90%的准确率预测婴儿哭泣的原因。然后,他们使用AI算法来区分由饥饿、疼痛和刺激引起的哭声。