![]()
文|劉俊宏
編|王一粟
在AI大模型走向應(yīng)用的時代,AI“賣鏟人”英偉達(dá)又帶來了最新的“參考答案”。
12月15日,英偉達(dá)正式發(fā)布了Nemotron 3系列開放AI模型。該模型系列包含Nano、Super和Ultra三種規(guī)模,模型主打效率和領(lǐng)先的精度,適用于AI Agent的應(yīng)用開發(fā)。
對于這套模型,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛總結(jié)說:“開放創(chuàng)新是AI進(jìn)步的基礎(chǔ)。通過Nemotron,我們將先進(jìn)AI轉(zhuǎn)化成開放平臺,為開發(fā)者提供構(gòu)建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”
本次發(fā)布的三個規(guī)模的模型,英偉達(dá)的設(shè)計目標(biāo)非常明確,直指AI應(yīng)用中的高效和節(jié)能。
Nemotron 3 Nano模型目前已經(jīng)上線。該模型參數(shù)總量為300億,由于模型采用了獨(dú)特的異構(gòu)MoE架構(gòu),這使得每次運(yùn)行時只需激活30億參數(shù)。模型能按需使用,非常省電。相比上一代模型,Nemotron 3 Nano速度快4倍,成本低60%,非常適合寫代碼、總結(jié)文檔、當(dāng)智能助手等日常任務(wù)。此外,模型還支持100萬token的上下文記憶能力。這相當(dāng)于記住幾本書的內(nèi)容,保證模型在使用中不會輕易忘事。
Nemotron 3 Super模型,預(yù)計于2026上半年推出,主打多智能體協(xié)作完成任務(wù)。該模型參數(shù)總量約1000億,每個token最多激活100億參數(shù),也是兼具了節(jié)能和高效。
Nemotron 3 Ultra模型,同樣預(yù)計于2026上半年推出。主要面對高級推理引擎,服務(wù)于需要深度研究和策略規(guī)劃的AI工作流,是Nemotron 3系列的“最強(qiáng)大腦”。該模型參數(shù)約5000億,每個token最多激活500億參數(shù),適用于復(fù)雜的AI應(yīng)用。
![]()
值得注意的是,Nemotron 3 Super與Ultra采用基于NVIDIA Blackwell架構(gòu)的4位NVFP4訓(xùn)練格式,可顯著降低顯存需求并加速訓(xùn)練進(jìn)程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練,不會因更高精度格式而犧牲準(zhǔn)確性。
簡單來說,是就是之前訓(xùn)練一個大模型需要最新、最好的GPU集群才能兼顧準(zhǔn)確性和效率。現(xiàn)在開發(fā)者可以在現(xiàn)有硬件上訓(xùn)練,不需要擔(dān)心低精度會讓AI“變傻”的問題。
英偉達(dá)推出Nemotron 3系列模型的想法,是想讓開發(fā)者能根據(jù)特定工作負(fù)載選擇更合適自己的開放模型。AI任務(wù)能在數(shù)十至數(shù)百個智能體間靈活擴(kuò)展,同時在復(fù)雜工作流中獲得更快速、精準(zhǔn)的長時推理能力。
簡單來說,就是英偉達(dá)為AI開發(fā)者提供了一套AI“積木”。應(yīng)對一項(xiàng)“大工程”,開發(fā)者可以按需選擇有小磚(Nano快)、中磚(Super穩(wěn))和大磚(Ultra強(qiáng))。或者同時招募幾十上百個“工人”(智能體)一起干活。
為了更方便開發(fā)者使用,本次英偉達(dá)在開源了模型之余,還開放了訓(xùn)練數(shù)據(jù)集和前沿強(qiáng)化學(xué)習(xí)庫。
為了給開發(fā)者示范高性能特定領(lǐng)域智能體如何創(chuàng)建推理、編碼及多步驟的工作流,英偉達(dá)本次公開了3 萬億token規(guī)模的全新Nemotron預(yù)訓(xùn)練、后訓(xùn)練及強(qiáng)化學(xué)習(xí)數(shù)據(jù)集。Nemotron Agentic Safety Dataset工具提供真實(shí)場景的遙測數(shù)據(jù),幫助團(tuán)隊(duì)評估并提升復(fù)雜智能體系統(tǒng)的安全性。
為了加速AI開發(fā)進(jìn)程,英偉達(dá)發(fā)布了NeMo Gym與NeMo RL開源庫。這能為Nemotron 模型提供訓(xùn)練環(huán)境及后訓(xùn)練基礎(chǔ)。在驗(yàn)證模型安全性和性能環(huán)節(jié),英偉達(dá)還推出了NeMo Evaluator。目前這些工具,都已經(jīng)在GitHub和Hugging Face平臺上線。
開發(fā)工具層面,Nemotron 3 已獲得LM Studio 、llama.cpp、SGLang 和vLLM支持。Prime Intellect與Unsloth正將NeMo Gym的即用型訓(xùn)練環(huán)境直接集成至其工作流,使團(tuán)隊(duì)能夠更加快速、便捷地獲得強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練能力。
為了方便Nemotron 3模型落地,AI云廠商們也做好了相應(yīng)的準(zhǔn)備。
目前,Nemotron 3 Nano已上線于Hugging Face平臺,提供推理服務(wù)的廠商有Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等公司。Nemotron還上線了多個企業(yè)級 AI 與數(shù)據(jù)基礎(chǔ)設(shè)施平臺,包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外,Nemotron 3 Nano將通過Amazon Bedrock(無服務(wù)器模式)在亞馬遜云科技平臺上提供給使用公有云的客戶,并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。Nemotron 3 Nano 同時還可以用 NVIDIA NIM 形式提供,開發(fā)者可在英偉達(dá)自己的平臺上選用。
總體來看,Nemotron 3 是英偉達(dá)想讓AI被更多人使用的一次努力。作為算力供應(yīng)商的英偉達(dá),依然是為開發(fā)者降低AI門檻,做開源生態(tài)的姿態(tài)。畢竟,只有AI開發(fā)者能一起賺錢,英偉達(dá)的GPU才能賣得更多。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.