人工智能的赢家是开源的

2023年10月31日由 camellia 发表 542 0

开源排行榜是一个参数，显示了开发人员在大型语言模型领域的迅速投入。根据Hugging Face排行榜的数据，在过去一个月里，Vicuna和Meta的Llama-2的不同版本已经被下载了数百万次。

3_副本

Meta的Llama-2是一套预训练和微调的生成文本模型，规模从70亿到700亿个参数不等，已经被下载了超过300万次。大型模型系统组织(LMSYS)发布了17个不同版本的Vicuna模型（7B和13B），下载量略超过100万次。

这表明，相比于大型科技公司，像OpenAI这样的主要供应商面临的最大威胁并不是来自于其他巨头，而是来自开源社区。与谷歌和OpenAI相比，Meta在走向开源方面取得了惊人的领先地位，后者将大部分技术保留在闭门之后，或者仅通过与特定公司的合作来使其可用。

关于Meta声誉的大幅提升在最近的一段时间内已经多次提出。之所以前述公司不愿让公众接触他们的技术，一部分原因是因为他们把这些技术视为产品而不仅仅是内部开发的基础设施。他们在构建这项技术时最终是考虑股东的利益，而不是开发人员。

Meta的言论

当Llama的初始版本被泄露后，Meta向GitHub和Hugging Face发送了下架请求以控制局面。然而，随着代码在互联网上的广泛传播，Meta放弃了尝试。相反，该公司接受了这个事实，并选择将其作为未来的发展方向，随后也发布了更多的模型。

公司开源觉醒背后的力量可能是其AI负责人Yann LeCun。尽管AI的基础牢固地根植于开源原则，但Llama作为首个主要的开源基准模型代表了一个里程碑。Meta的Simon一直在网络和社区中积极倡导开源，每天都在关注这一话题。

从转发关于“保持AI开放”的推文到回复其他AI专家的讨论，LeCun毫不犹豫。就在几个小时前，LeCun回复麻省理工学院教授Max Tegmark时表示：“像许多人一样，我非常支持开放的AI平台，因为我相信这是多种力量的结合：人们的创造力、民主、市场力量和产品监管。

除了提供对Llama模型的访问之外，Meta还分享了其权重，而其他主要的语言模型则没有。权重代表模型在训练过程中获得的参数，简化了AI算法的开发和执行。相比之下，其他GPT模型仅通过应用程序编程接口（API）访问。

Meta可能已经超过了OpenAI和谷歌。最近有一份谷歌的内部备忘录在网上流传，一位谷歌AI工程师将开源社区称为“第三派系，悄悄地让我们吃了闭门羹”。

经济价值

现在就连投资者也在讨论开源。Unusual Ventures的常务合伙人Wei Lien Dang表示：“如果回到九个月前，你是看不到开源替代方案来挑战OpenAI和一些领先的专有解决方案的。”“这种现象已经显著增加。”

显然，投资者已经选择了开源作为可靠的竞争对手。甚至NFX的一位常务合伙人James Currier也注意到从闭源转向开源模型的显著节省成本的优势。在他的投资组合中，一家公司以前每月需要花费15万美元才能访问特定模型。然而，采用了开源替代方案后，该创业公司的运营成本大幅降低，同样的模型每月开支只有4000美元。

在某种程度上，应当给予Meta和LeCun对开源语言模型的倾向一定的认可。一个月前，LeCun发推文称，AI系统正在迅速成为基础设施的一部分。他还指出，在历史上，基础设施通常以开源形式存在，例如互联网的软件基础设施、Linux、Apache和JavaScript浏览器引擎。

尽管公司继续为其技术投入资金，但开源社区更有可能获得最终的胜利。

文章来源：https://analyticsindiamag.com/and-the-ai-winner-is-open-source/

标签：

人工智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇计算模型可以像大脑一样认识世界

下一篇百度文心一言会员模式上线，大模型4.0助力创作

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术