英偉達(dá)推出Nemotron 3系列開放模型，AI Agent開源了？

2025-12-16 20:26:05　來源: 光錐智能

北京舉報

分享至

文｜劉俊宏

編｜王一粟

在AI大模型走向應(yīng)用的時代，AI“賣鏟人”英偉達(dá)又帶來了最新的“參考答案”。

12月15日，英偉達(dá)正式發(fā)布了Nemotron 3系列開放AI模型。該模型系列包含Nano、Super和Ultra三種規(guī)模，模型主打效率和領(lǐng)先的精度，適用于AI Agent的應(yīng)用開發(fā)。

對于這套模型，英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛總結(jié)說：“開放創(chuàng)新是AI進(jìn)步的基礎(chǔ)。通過Nemotron，我們將先進(jìn)AI轉(zhuǎn)化成開放平臺，為開發(fā)者提供構(gòu)建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”

本次發(fā)布的三個規(guī)模的模型，英偉達(dá)的設(shè)計目標(biāo)非常明確，直指AI應(yīng)用中的高效和節(jié)能。

Nemotron 3 Nano模型目前已經(jīng)上線。該模型參數(shù)總量為300億，由于模型采用了獨(dú)特的異構(gòu)MoE架構(gòu)，這使得每次運(yùn)行時只需激活30億參數(shù)。模型能按需使用，非常省電。相比上一代模型，Nemotron 3 Nano速度快4倍，成本低60%，非常適合寫代碼、總結(jié)文檔、當(dāng)智能助手等日常任務(wù)。此外，模型還支持100萬token的上下文記憶能力。這相當(dāng)于記住幾本書的內(nèi)容，保證模型在使用中不會輕易忘事。

Nemotron 3 Super模型，預(yù)計于2026上半年推出，主打多智能體協(xié)作完成任務(wù)。該模型參數(shù)總量約1000億，每個token最多激活100億參數(shù)，也是兼具了節(jié)能和高效。

Nemotron 3 Ultra模型，同樣預(yù)計于2026上半年推出。主要面對高級推理引擎，服務(wù)于需要深度研究和策略規(guī)劃的AI工作流，是Nemotron 3系列的“最強(qiáng)大腦”。該模型參數(shù)約5000億，每個token最多激活500億參數(shù)，適用于復(fù)雜的AI應(yīng)用。

值得注意的是，Nemotron 3 Super與Ultra采用基于NVIDIA Blackwell架構(gòu)的4位NVFP4訓(xùn)練格式，可顯著降低顯存需求并加速訓(xùn)練進(jìn)程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練，不會因更高精度格式而犧牲準(zhǔn)確性。

簡單來說，是就是之前訓(xùn)練一個大模型需要最新、最好的GPU集群才能兼顧準(zhǔn)確性和效率。現(xiàn)在開發(fā)者可以在現(xiàn)有硬件上訓(xùn)練，不需要擔(dān)心低精度會讓AI“變傻”的問題。

英偉達(dá)推出Nemotron 3系列模型的想法，是想讓開發(fā)者能根據(jù)特定工作負(fù)載選擇更合適自己的開放模型。AI任務(wù)能在數(shù)十至數(shù)百個智能體間靈活擴(kuò)展，同時在復(fù)雜工作流中獲得更快速、精準(zhǔn)的長時推理能力。

簡單來說，就是英偉達(dá)為AI開發(fā)者提供了一套AI“積木”。應(yīng)對一項(xiàng)“大工程”，開發(fā)者可以按需選擇有小磚（Nano快）、中磚（Super穩(wěn)）和大磚（Ultra強(qiáng)）。或者同時招募幾十上百個“工人”（智能體）一起干活。

為了更方便開發(fā)者使用，本次英偉達(dá)在開源了模型之余，還開放了訓(xùn)練數(shù)據(jù)集和前沿強(qiáng)化學(xué)習(xí)庫。

為了給開發(fā)者示范高性能特定領(lǐng)域智能體如何創(chuàng)建推理、編碼及多步驟的工作流，英偉達(dá)本次公開了3 萬億token規(guī)模的全新Nemotron預(yù)訓(xùn)練、后訓(xùn)練及強(qiáng)化學(xué)習(xí)數(shù)據(jù)集。Nemotron Agentic Safety Dataset工具提供真實(shí)場景的遙測數(shù)據(jù)，幫助團(tuán)隊(duì)評估并提升復(fù)雜智能體系統(tǒng)的安全性。

為了加速AI開發(fā)進(jìn)程，英偉達(dá)發(fā)布了NeMo Gym與NeMo RL開源庫。這能為Nemotron 模型提供訓(xùn)練環(huán)境及后訓(xùn)練基礎(chǔ)。在驗(yàn)證模型安全性和性能環(huán)節(jié)，英偉達(dá)還推出了NeMo Evaluator。目前這些工具，都已經(jīng)在GitHub和Hugging Face平臺上線。

開發(fā)工具層面，Nemotron 3 已獲得LM Studio 、llama.cpp、SGLang 和vLLM支持。Prime Intellect與Unsloth正將NeMo Gym的即用型訓(xùn)練環(huán)境直接集成至其工作流，使團(tuán)隊(duì)能夠更加快速、便捷地獲得強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練能力。

為了方便Nemotron 3模型落地，AI云廠商們也做好了相應(yīng)的準(zhǔn)備。

目前，Nemotron 3 Nano已上線于Hugging Face平臺，提供推理服務(wù)的廠商有Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等公司。Nemotron還上線了多個企業(yè)級 AI 與數(shù)據(jù)基礎(chǔ)設(shè)施平臺，包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外，Nemotron 3 Nano將通過Amazon Bedrock（無服務(wù)器模式）在亞馬遜云科技平臺上提供給使用公有云的客戶，并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。Nemotron 3 Nano 同時還可以用 NVIDIA NIM 形式提供，開發(fā)者可在英偉達(dá)自己的平臺上選用。

總體來看，Nemotron 3 是英偉達(dá)想讓AI被更多人使用的一次努力。作為算力供應(yīng)商的英偉達(dá)，依然是為開發(fā)者降低AI門檻，做開源生態(tài)的姿態(tài)。畢竟，只有AI開發(fā)者能一起賺錢，英偉達(dá)的GPU才能賣得更多。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.