
英伟达公司今日宣布推出Nemotron 3,这是一个开放的模型和数据库家族,旨在为各行业的下一代代理人工智能操作提供动力。
新的模型家族将包括三种尺寸:Nano、Super和Ultra。公司采用突破性的架构构建了这些模型,使用混合潜在专家混合方法来压缩内存需求,优化计算并为不同尺寸提供卓越的智能。
据公司称,最小的模型Nemotron 3 Nano的吞吐量是其前代产品的四倍,同时保持高性能。
“开放创新是AI进步的基础,”英伟达公司创始人兼首席执行官黄仁勋表示。“通过Nemotron,我们将先进的AI转变为一个开放平台,为开发者提供他们所需的透明性和效率,以大规模构建代理系统。”
公司表示,这些AI模型的发布应对了行业对需要推理和工具编排的代理AI应用的快速采用。单一模型聊天机器人的时代正在让位于编排的AI应用,这些应用自动化多个模型以推动主动和智能代理。
Nemotron 3的推出也使英伟达更直接地面对一个日益增长的开放和半开放推理模型领域,因为竞争从原始参数数量转向编排、可靠性和以代理为中心的性能。
利用其新架构,英伟达表示将帮助降低成本,同时仍提供高速、可靠的推理和智能。
今天推出的Nano是一个小型300亿参数模型,具有30亿活跃参数,旨在针对性、高效的任务。下一个较大的模型Super结合了1000亿参数和100亿活跃参数,旨在为多代理应用提供中等范围的智能。最后,Ultra是一个大型推理引擎,重达5000亿参数,具有500亿活跃参数,为复杂的AI应用和代理编排提供推理。
Nemotron Super在将多个AI代理结合在一起以低延迟协作完成复杂任务的应用中表现出色。相比之下,Nemotron Ultra被定位为在需要深度研究和长期战略规划的苛刻AI工作流中心的强大“头脑”。
Nano现已上市,Super将在2026年第一季度推出,Ultra预计将在明年上半年推出。
使用公司超高效的4位NVPF4训练格式,开发者和工程师可以在较少数量的图形处理单元上部署模型,显著减少内存占用。高效的训练过程还允许模型通过蒸馏缩小规模,而不会显著损失准确性或推理能力。
Nemotron家族的早期采用者包括埃森哲公司、CrowdStrike Holdings Inc.、甲骨文云基础设施、Palantir Technologies Inc.、Perplexity AI Inc.、ServiceNow Inc.、西门子公司和Zoom Communications Inc.
“Perplexity建立在这样一个理念上:人类的好奇心将通过内置于卓越工具中的准确AI得到放大,比如AI助手,”Perplexity首席执行官Aravind Srinivas说。“通过我们的代理路由器,我们可以将工作负载引导到最佳微调的开放模型,如Nemotron 3 Ultra。”
随着这些模型的发布,英伟达在生态系统驱动的采用上押下重注,以创造互惠互利的共生关系。虽然新模型不需要英伟达硬件运行,但由于内部架构优化,它们高度优化于英伟达设计的平台和显卡。
公司还强调了其保持模型发布可靠性路线图的意图。尽管当前AI模型发布的节奏可能让人感到无情,几乎每月都有新发布,英伟达表示其目标是为开发者提供更清晰的模型成熟度和每个开源家族的长期支持预期。
除了新模型,英伟达还发布了一系列训练数据集和最先进的强化学习库,用于构建专门的AI代理。
强化学习是一种通过将AI模型暴露于真实世界的问题、指令和任务中进行训练的方法。与依赖预定义问答数据集的监督学习不同,强化学习将模型置于不确定的环境中,通过奖励强化成功的行动并惩罚错误。结果是一个能够在复杂、动态条件下操作的推理系统,通过主动反馈学习规则和界限。
新的数据集包含3万亿个新的Nemotron预训练、后训练和强化的标记,以提供丰富的推理、编码和多步骤工作流示例。这些为构建高能力、领域专用的代理提供了框架。此外,英伟达发布了Nemotron代理安全数据集,这是一个真实世界的遥测数据集,允许团队评估和加强复杂和多代理系统的安全性。
在此基础上,英伟达发布了NeMo Gym和NeMo RL开源库。Gym和RL提供训练环境和Nemotron模型的后训练基础。开发者可以将它们结合使用,作为脚手架,通过使用RL训练循环运行模型来加速开发,并与现有训练环境互操作。
开源Nemotron模型和数据集的发布进一步巩固了英伟达对更广泛AI生态系统的影响。
