谷歌的“开放”AI模型家族Gemma正在不断壮大。
在2025年谷歌I/O大会上周二,谷歌发布了Gemma 3n,这是一款专为在手机、笔记本电脑和平板电脑上“流畅”运行而设计的模型。从周二开始提供预览版。据谷歌称,Gemma 3n能够处理音频、文本、图像和视频。
近年来,在AI社区中,能够离线运行且无需云计算的高效模型越来越受欢迎。它们不仅比大型模型使用成本更低,而且通过消除将数据传输到远程数据中心的需求来保护隐私。
除了Gemma 3n,谷歌还通过其健康AI开发者基础计划发布了MedGemma。根据公司介绍,MedGemma是其最强大的开放模型,用于分析与健康相关的文本和图像。
即将推出的还有SignGemma,这是一款将手语翻译成口语文本的开放模型。谷歌表示,SignGemma将使开发者能够为聋人和听力障碍用户创建新的应用程序和集成。
值得注意的是,Gemma因其定制的、非标准的许可条款而受到批评。一些开发者表示这使得商业使用这些模型成为一种风险。然而,这并没有阻止开发者下载Gemma模型数千万次的热情。