Meta开源新人工智能模型Llama 2

2023年07月31日由 Susan 发表 693301 0

Meta正在开源其大型语言模型Llama 2。该模型的代码和权重可以免费用于研究和商业用途。

Llama 2是Meta和微软扩展伙伴关系的结果，微软成为新模型的首选合作伙伴。该模型可在Azure人工智能模型目录中获得，让使用Microsoft Azure的开发人员可以将其集成到项目中，并利用云原生工具进行内容过滤和安全功能。Llama 2还经过优化，可以在Windows上本地运行，为开发人员带来更简化的工作流程。

根据Meta的说法，与之前的Llama版本相比，Llama 2的训练数据量增加了40％以上，并在推理和知识测试方面优于其他语言模型。斯坦福大学基础模型研究中心主任Percy Liang评论道：“Llama 2并非GPT-4，但对于许多用例，你并不需要GPT-4。”

Meta的首席人工智能科学家Yann Lecun表示，有兴趣利用Llama 2的开发人员可以通过微软的Azure平台、亚马逊网络服务（AWS）、Hugging Face和其他提供商访问该模型。

Meta表示，发布Llama 2伴随着一系列资源以确保负责任的使用。这些资源包括红队演练、透明度计划、负责任使用指南和可接受使用政策。

Nvidia的人工智能科学家Jim Fan指出，“在编码基准测试上存在明显差距。在大多数基准测试中，它与PaLM-540B水平相当或更好，但仍远落后于GPT-4和PaLM-2-L。”

《麻省理工科技评论》指出，Meta没有公布用于训练Llama 2的数据集的信息，该模型“与所有大型语言模型一样存在一些问题：易于产生虚假信息和冒犯语言。”

开发人员可以参考模型卡片获取更多信息或开始编写自己的代码。模型卡片指出该模型仅适用于英文。

此举是在两名美国参议员此前向Meta的首席执行官提出关于此类发布的问题后采取的，他们在信中写道，“该公司的首席人工智能科学家曾表示，开放模型对于其商业成功至关重要”，并断言先前的开放发布“放任和宽容的方式引发了重要而复杂的问题”。

Meta还启动了新的计划以收集有关模型性能和潜在改进的反馈意见。Meta表示：“我们认为开放的方式对于当今的人工智能模型开发是正确的选择，特别是在生成领域，这里的技术正在迅速发展。”

来源：https://www.infoq.com/news/2023/07/meta-new-ai-model/

标签：

学习人工智能 Meta Llama 2

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇是否可以在不使用Discord的情况下使用Midjourney？

下一篇 GPT-3 ace 类比推理测试

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术