Hugging Face上已拥有数千个Llama 3模型变种

2024年04月23日 由 samoyed 发表 45 0

上周,Meta 发布了其最新大型语言模型 Llama 3 的早期版本,引起了热烈的反响。Hugging Face 的联合创始人兼首席执行官 Clem Delangue 在一篇文章中提到,到下个周末,将有10000多个变种可用,因为 Hugging Face 上已经公开分享了 1000 个 Llama 3 模型变种。


Did-Meta-AIs-Llama-3-meet-the-developers-expectations.-


这个新模型包括一个图像生成器,可以在用户输入提示时实时更新图片。Meta 发布了两个版本的 Llama 3——一个包含 80 亿个参数,另一个包含 700 亿个参数。


Meta 声称,在某些基准测试中,Llama 3 的两个版本都击败了同等大小的模型,如 Google 的 Gemma 和 Gemini、Mistral 7B,以及 Anthropic 的 Claude 3。


在 Reddit 上的一次对话中,有人声称 Llama-3 的 80 亿参数指导模型在基准测试中的表现优于 Llama-2 的 700 亿参数指导模型。


与 Meta 的 Llama 2 模型相比,Llama 3 的token数量从 32000(Llama 2)增加到 128000。由于token数量更多,Llama 3 可以更高效地压缩序列,减少 15% 的token数量,并提供更好的下游性能。


today-14.png


特斯拉 AI 总监 Andrej Karpathy 在他的帖子中表示支持发布 80 亿和 700 亿参数的基础模型和微调模型。他还强调了更小模型的需求,特别是用于教育目的、单元测试以及潜在的嵌入式应用。


Karpathy 还谈到了局限性。虽然序列长度的增加是朝着正确方向迈出的一步,但他指出这仍然达不到行业领先的标准。


除了这些局限性,Perplexity AI 的首席执行官 Arvind Srinivas 表示:“Llama 3 最让我印象深刻的一点是,他们是如何将如此多的知识和推理如此出色地打包到密集的 80 亿和 700 亿参数中的,而其他人都在扩大稀疏 MoEs 的规模。”


这并不意味着拥有很多 GPU 不重要。考虑到要运行多少次才能获得正确的数据组合,它可能甚至更重要。


Kissan AI 的创始人 Pratik Desai 发布了基于 Llama3 8B 微调的 Dhenu Llama 3。“它可供任何人摆弄并提供反馈。如果你有闲置的 GPU,请随意托管和分享。在不久的将来,我们将拥有一个带有五倍大数据集的指令版本,”Desai 在 X 上写道。


在支持研究人员的同时,Reddit Llama 3推出了 GroqInc 的“Llama 3 Researcher”,以每秒 876 个token的速度提供 Llama 3 8B——这是我们所基准测试过的任何模型中最快的速度。


据 AI 新闻网站 The Rundown AI 的创始人 Rowan Cheung 表示,这就像一个 GPT-4 级别的聊天机器人,完全免费使用,在 Groq 上每秒运行超过 800 个token。


此外,Groq 在 Llama 3 上每秒吐出 800 个token,这预示着在本地 AI 代理下将发生多个动作的新用例,Brian Roemmele 写道。


Meta的首席AI科学家Yann LeCun透露,目前正在开发更强大的语言模型。LeCun指出,拥有超过4000亿参数的最先进的Llama模型正在进行训练。


新发布的AI模型将集成到Meta的虚拟助手Meta AI中,该公司声称这是其免费同类产品中最先进的。


NVIDIA的Jim Fan表示,即将推出的Llama-3 400B+将标志着社区获得GPT-4级别模型开放权重访问的转折点。此外,他表示,这将改变许多研究工作和草根创业公司的计算方式。


“我对比了Claude 3 Opus、GPT-4和Gemini的数据。Llama 3 400B仍在训练中,希望在未来几个月内会变得更好,”他补充说,如此强大的基础架构可以解锁大量的研究潜力。


预计整个生态系统的构建者能量将会激增!


文章来源:https://analyticsindiamag.com/hugging-face-already-has-1000s-of-llama-3-models-and-counting/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消