
又一家有前途的AI初创公司的顶尖人才被一家老牌公司收购。作为一项新的许可协议的一部分,谷歌DeepMind正在引入语音AI初创公司Hume AI的CEO和几位顶尖工程师。
Hume AI的其余部分将继续向其他AI公司提供其技术。交易的财务细节尚未披露。
据报道,CEO Alan Cowen和大约七名其他工程师将与DeepMind合作,以改进Gemini的语音功能。
Hume的收购是领先AI公司通过收购初创公司团队而非公司本身来规避监管审查的最新例子。去年,谷歌收购了病毒式传播的AI编码初创公司Windsurf的CEO和其他顶尖研究人员,而OpenAI在最近几个月也收购了几家初创公司团队,包括Covogo和Roi。联邦贸易委员会最近表示将更仔细地审查此类交易。
这笔交易也表明语音正在成为AI的下一个前沿领域。
Hume AI的秘密武器是其模型能够根据用户的语音理解其情绪和心情。2024年,这家初创公司推出了其具备情感智能的对话AI——Empathetic Voice Interface。据PitchBook称,Hume AI迄今已筹集了近8000万美元,并预计今年将带来1亿美元的收入。
但Hume AI并不是唯一一家致力于语音模型的公司。谷歌一直在稳步改进其Gemini Live功能,该功能允许用户与聊天机器人进行对话。上个月,谷歌发布了一款新的本地音频模型用于Live API,提升了模型“处理复杂工作流程”的能力,据Gemini API发布说明。
业内其他公司也在大力投资语音功能。据报道,OpenAI正在准备全面改革其音频模型,以为与Jonny Ive的io合作创建的音频优先个人设备的发布做准备。最近的泄露信息显示,该设备可能是一种耳塞。
去年,Meta也通过收购初创公司Play AI加速了其AI音频推进。Facebook制造商的Ray-Ban智能眼镜越来越依赖语音和音频功能来完成诸如帮助你在嘈杂的房间里听到对话以及实现免提控制通话、短信、音乐和照片等任务。
“语音是可穿戴设备唯一可接受的输入模式,”投资者Vanessa Larc讲到。“这次收购只会加速对语音应用的需求。”
对语音功能的需求持续增长。本月早些时候,AI语音生成初创公司ElevenLabs表示其年经常性收入已超过3.3亿美元。
