谷歌DeepMind推出Gemma 2系列,首个270亿参数轻量级模型

2024年05月15日 由 neo 发表 97 0

去年二月,谷歌DeepMind推出了Gemma系列,并发布了两个开源模型,分别包含20亿和70亿参数。而在今天的Google I/O开发者大会上,谷歌再次推出其重磅升级——Gemma 2系列,首个成员便是一个拥有270亿参数的更大规模轻量级模型。不过,这款模型并不会立即可用,预计将在今年6月与大家见面。

谷歌实验室副总裁Josh Woodward在上周的记者圆桌会议上详细解释了这一决定:“我们特意选择了270亿参数这个规模,它经过优化,可以在Nvidia的下一代GPU或Vertex AI中的单个TPU主机上高效运行。这也是它易于使用的原因之一。我们已经看到了它出色的表现,其性能甚至超过了比它大两倍的模型。”

1715712573771-EYIl6FoHNm

Gemma系列是谷歌专为开发者打造的轻量级模型系列,旨在帮助开发者将AI技术集成到他们的应用程序和设备中,同时避免消耗大量的内存或处理能力。这使得Gemma系列特别适用于资源受限的设备,如智能手机、物联网设备和个人电脑。自今年早些时候推出以来,谷歌已经为Gemma系列添加了多个变体,包括专门用于代码补全的CodeGemma、提高内存效率的RecurrentGemma,以及最近推出的视觉-语言模型PaliGemma。

现在,拥有270亿参数的Gemma 2系列承诺将为开发者提供更准确的结果和卓越的性能,同时能够处理比其前身更为复杂的任务。通过更大规模的数据集进行训练,Gemma 2系列能够在更短的时间内提供更高质量的响应。

Woodward强调,虽然Gemma 2系列被设计为在单个TPU上运行,但他所指的是谷歌最新一代计算机芯片TPUv5e,该芯片于去年八月发布。这意味着,使用Gemma 2系列需要一个专门的AI芯片来处理计算任务,从而大幅减少延迟,并高效处理图像识别、自然语言处理等复杂任务。对于开发者来说,这意味着他们可以节省更多的资源来重新投资于他们的应用程序。

值得一提的是,Gemma 2系列的首次亮相正值OpenAI公布其多模态LLM GPT-4o之际,GPT-4o被称为对用户当前体验的“重大升级”,特别是对那些使用ChatGPT免费版本的用户来说。然而,谷歌DeepMind的Gemma 2系列无疑也为AI技术的发展和应用提供了新的可能性和方向。

文章来源:https://venturebeat.com/ai/google-gemma-2-27-billion-lightweight-model/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消