Meta AI为移动设备开发紧凑型语言模型

2024年07月09日由 samoyed 发表 503 0

Meta AI的研究人员发布了一种为智能手机和其他资源受限设备设计的高效语言模型的新方法——MobileLLM

研究团队由来自Meta Reality Labs、PyTorch 和 Meta AI Research（FAIR）的成员组成，他们专注于优化参数少于 10 亿的模型。这仅是像 GPT-4 这样估计拥有超过一万亿参数的模型大小的一小部分。

mobilellm-meta

MobileLLM的关键创新包括：

1、优先考虑模型深度而非宽度

2、实现嵌入共享和分组查询注意力

3、采用新颖的即时块级权重共享技术

这些设计选择使得MobileLLM在常见的基准任务上，能够比先前同等大小的模型高出 2.7% 至 4.3% 的性能。尽管这些个位数的改进看似微小，但在竞争激烈的语言模型开发领域，它们代表了有意义的进步。

值得注意的是，MobileLLM 的 3.5 亿参数版本在某些 API 调用任务上的准确率与远大于其的 70 亿参数 LLaMA-2 模型相当。这表明，对于某些特定应用，更紧凑的模型可能在使用显著更少的计算资源的同时，提供类似的功能。

MobileLLM 的开发符合对更高效 AI 模型日益增长的兴趣。随着超大型语言模型的发展显现出放缓的迹象，研究人员越来越多地探索更紧凑、更专业设计的潜力。尽管其名称中包含“LLM”（大型语言模型），但 MobileLLM 对效率和设备端部署的关注使其与一些研究人员所称的小型语言模型属于同一类别。

虽然 MobileLLM 目前尚未向公众开放，但 Meta 已经开源了预训练代码，允许其他研究人员在此基础上进行开发。随着这项技术的发展，它可能会在个人设备上实现更高级的 AI 功能，尽管具体的时间表和能力尚不确定。

MobileLLM 的开发标志着使高级 AI 更加普及和可持续的重要一步。它挑战了有效语言模型必须庞大的观念，可能为个人设备上的 AI 应用开辟新的途径。

文章来源：https://venturebeat.com/ai/meta-ai-develops-compact-language-model-for-mobile-devices/

标签：

Meta

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 AI驱动知识公司Hebbia获得1.3亿美元投资

下一篇 OpenAI CEO 奥尔特曼与赫芬顿成立一个新的AI健康公司

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市