
Meta Platforms Inc.计划发布其下一代人工智能模型的开源版本。
该公司首次推出其最强大的神经网络是在去年四月。被称为Llama 4 Maverick的算法是一个拥有4000亿参数的开源大型语言模型。去年十二月,消息人士告诉彭博社Meta计划在未来的LLM中转向闭源分发方式。
该公司正在据报道开发两个专有的前沿模型。其中一个代号为Avocado的LLM和一个内部称为Mango的多媒体文件生成器。预计这两个算法将在今年推出。今天Axios报告中详细描述的开源模型可能源自Avocado和Mango。
尚不清楚开源版本是否会与专有版本同时推出。Axios报道说,前者算法将“最终”推出。它们是Meta努力在全球范围内广泛分发其模型的一部分。
据报道,开源版本不会包含闭源版本中可用的所有功能。目前尚不清楚Meta将省略哪些功能。
Llama 4 Maverick是该公司最好的开源LLM,基于专家混合架构。它不是一个单一的算法,而是128个不同的神经网络,每个网络都针对不同的任务进行了优化。Meta即将推出的开源模型可能缺少一些支持专有版本的神经网络。
另一种可能性是公司将缩减开源版本的参数数量或跳过某些训练步骤。前沿LLM经过多轮训练,包括在其核心能力已经到位后进行的所谓后训练。开源模型开发者发布未经过后训练的缩减版算法并不罕见。AI安全据报道是Meta开源模型不会包含专有版本所有功能的原因之一。这暗示Avocado将擅长生成与网络安全相关的代码。Claude 4.6 Opus,Anthropic PBC最强大的LLM,到目前为止
发现了开源项目中的数百个关键漏洞。
Anthropic和OpenAI Group PBC都在准备发布新的旗舰LLM。根据Axios的报道,Meta并不期望其即将推出的模型在“全面”上超越竞争对手。然而,Facebook母公司的算法据报道在多个“优势领域”具有吸引消费者的潜力。
Meta可能通过使其模型比竞争对手更具硬件效率来吸引消费者。许多前沿LLM由于处理器限制无法在个人电脑上运行。Meta也可能会优化算法用于个人健康和作业辅助等企业不优先考虑的用例。
