谷歌DeepMind推出Gemma 2系列，首个270亿参数轻量级模型

2024年05月15日由 neo 发表 906 0

去年二月，谷歌DeepMind推出了Gemma系列，并发布了两个开源模型，分别包含20亿和70亿参数。而在今天的Google I/O开发者大会上，谷歌再次推出其重磅升级——Gemma 2系列，首个成员便是一个拥有270亿参数的更大规模轻量级模型。不过，这款模型并不会立即可用，预计将在今年6月与大家见面。

谷歌实验室副总裁Josh Woodward在上周的记者圆桌会议上详细解释了这一决定：“我们特意选择了270亿参数这个规模，它经过优化，可以在Nvidia的下一代GPU或Vertex AI中的单个TPU主机上高效运行。这也是它易于使用的原因之一。我们已经看到了它出色的表现，其性能甚至超过了比它大两倍的模型。”

1715712573771-EYIl6FoHNm

Gemma系列是谷歌专为开发者打造的轻量级模型系列，旨在帮助开发者将AI技术集成到他们的应用程序和设备中，同时避免消耗大量的内存或处理能力。这使得Gemma系列特别适用于资源受限的设备，如智能手机、物联网设备和个人电脑。自今年早些时候推出以来，谷歌已经为Gemma系列添加了多个变体，包括专门用于代码补全的CodeGemma、提高内存效率的RecurrentGemma，以及最近推出的视觉-语言模型PaliGemma。

现在，拥有270亿参数的Gemma 2系列承诺将为开发者提供更准确的结果和卓越的性能，同时能够处理比其前身更为复杂的任务。通过更大规模的数据集进行训练，Gemma 2系列能够在更短的时间内提供更高质量的响应。

Woodward强调，虽然Gemma 2系列被设计为在单个TPU上运行，但他所指的是谷歌最新一代计算机芯片TPUv5e，该芯片于去年八月发布。这意味着，使用Gemma 2系列需要一个专门的AI芯片来处理计算任务，从而大幅减少延迟，并高效处理图像识别、自然语言处理等复杂任务。对于开发者来说，这意味着他们可以节省更多的资源来重新投资于他们的应用程序。

值得一提的是，Gemma 2系列的首次亮相正值OpenAI公布其多模态LLM GPT-4o之际，GPT-4o被称为对用户当前体验的“重大升级”，特别是对那些使用ChatGPT免费版本的用户来说。然而，谷歌DeepMind的Gemma 2系列无疑也为AI技术的发展和应用提供了新的可能性和方向。

文章来源：https://venturebeat.com/ai/google-gemma-2-27-billion-lightweight-model/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌发布新型AI模型Gemini 1.5 Flash，一种快速多模态模型

下一篇 Hugging Face发布LeRobot，简化机器人开发

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术