網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

公開的秘密：NVIDIA Nemotron 模型、數(shù)據(jù)集和技術(shù)如何推動(dòng) AI 發(fā)展

2025-09-29 18:27:04　來(lái)源: NVIDIA英偉達(dá)中國(guó)

北京舉報(bào)

分享至

Nemotron 開源技術(shù)能夠幫助開發(fā)者與企業(yè)構(gòu)建強(qiáng)大的通用和專用智能系統(tǒng)。

開放技術(shù)可供開發(fā)者與企業(yè)自由使用、修改和創(chuàng)新，貫穿了從互聯(lián)網(wǎng)誕生到云計(jì)算早期的每次重大技術(shù)變革。AI 也不該例外。

因此，NVIDIA Nemotron 多模態(tài) AI 模型、數(shù)據(jù)集和技術(shù)已向公眾全面開放。Nemotron 可用于本地個(gè)人電腦到企業(yè)級(jí)系統(tǒng)上的研究與商業(yè)用途，提供了一個(gè)開放的 AI 應(yīng)用構(gòu)建基礎(chǔ)平臺(tái)。開發(fā)者可通過(guò) GitHub、Hugging Face 和 OpenRouter 使用。

通過(guò) Nemotron，開發(fā)者、初創(chuàng)公司及各種規(guī)模的企業(yè)都能使用基于透明開源訓(xùn)練數(shù)據(jù)訓(xùn)練而成的模型。此外，Nemotron 還提供加速工具，覆蓋從定制到部署的全開發(fā)流程。

由于該技術(shù)的公開透明性，使用者能夠理解模型的運(yùn)作機(jī)制并信任其輸出結(jié)果。

憑借其在通用智能與代理式 AI 推理方面的能力，以及對(duì)特定 AI 用例的適應(yīng)性，Nemotron 如今已被制造、醫(yī)療、教育及零售等行業(yè)的 AI 創(chuàng)新者與領(lǐng)導(dǎo)者廣泛使用。

什么是 NVIDIA Nemotron？

NVIDIA Nemotron 是一套專為提高 AI 開發(fā)全流程效率而打造的開源 AI 技術(shù)集合，包含：

多模態(tài)模型：以開放檢查點(diǎn)形式交付的先進(jìn) AI 模型，在研究生級(jí)別科學(xué)推理、高等數(shù)學(xué)、編碼、指令執(zhí)行、工具調(diào)用、視覺(jué)推理方面表現(xiàn)出色。

預(yù)訓(xùn)練、后訓(xùn)練及多模態(tài)數(shù)據(jù)集：精心篩選的文本、圖像和視頻數(shù)據(jù)集合，可用于訓(xùn)練 AI 模型掌握語(yǔ)言、數(shù)學(xué)和問(wèn)題解決等技能。

數(shù)值精度算法和方案：先進(jìn)的精度技術(shù)，能在保障答案準(zhǔn)確性的同時(shí)，大幅提升 AI 運(yùn)行速度并降低成本。

用于高效擴(kuò)展 GPU 集群上訓(xùn)練規(guī)模的系統(tǒng)軟件：這是一系列經(jīng)過(guò)優(yōu)化的軟件與框架，可在 NVIDIA GPU 上實(shí)現(xiàn)大規(guī)模訓(xùn)練與推理加速，適配超大模型的需求。

后訓(xùn)練方法與軟件：提高 AI 智能水平、安全性和特定任務(wù)處理能力的微調(diào)步驟。

NVIDIA 致力于為開發(fā)者、行業(yè)領(lǐng)導(dǎo)者和公共及私營(yíng)領(lǐng)域的 AI 基礎(chǔ)設(shè)施構(gòu)建者提供開放、透明且自適應(yīng)的 AI 平臺(tái)，而 Nemotron 正是該戰(zhàn)略的重要組成部分。

通用智能與專用智能有何區(qū)別？

NVIDIA 開發(fā) Nemotron 是為了提升通用智能的能力（包括 AI 推理能力），同時(shí)加速專業(yè)化進(jìn)程，進(jìn)而幫助全球企業(yè)使用 AI 解決行業(yè)難題。

通用智能是指基于海量公開數(shù)據(jù)集訓(xùn)練而成、可執(zhí)行廣泛任務(wù)的模型，是解決各類問(wèn)題和執(zhí)行各類推理任務(wù)必不可少的引擎。專用智能學(xué)習(xí)某一行業(yè)或組織機(jī)構(gòu)特有的語(yǔ)言、流程及優(yōu)先事項(xiàng)，使 AI 模型能夠適應(yīng)特定的現(xiàn)實(shí)應(yīng)用。

要實(shí)現(xiàn) AI 在各行業(yè)的規(guī)模化應(yīng)用，兩者缺一不可。

因此，Nemotron 提供了針對(duì)多種計(jì)算平臺(tái)優(yōu)化的預(yù)訓(xùn)練基礎(chǔ)模型，以及 NVIDIA NeMo 和 NVIDIA Dynamo 等工具，以將通用 AI 模型轉(zhuǎn)化為定制化的專用智能模型。

開發(fā)者與企業(yè)如何使用 Nemotron？

NVIDIA 開發(fā) Nemotron 的目標(biāo)是加快全球開發(fā)者的工作進(jìn)程，并且為未來(lái) AI 系統(tǒng)設(shè)計(jì)指明方向。

無(wú)論是研究機(jī)構(gòu)還是初創(chuàng)公司和跨國(guó)企業(yè)，開發(fā)者都需要靈活、可信的 AI。Nemotron 提供了構(gòu)建、定制和集成 AI 的工具，適用于幾乎所有領(lǐng)域。

CrowdStrike 正將面向安全團(tuán)隊(duì)的 Charlotte AI AgentWorks 無(wú)代碼平臺(tái)與 Nemotron 集成，幫助推動(dòng)代理式生態(tài)系統(tǒng)的發(fā)展并保護(hù)其安全。此次合作重新定義了安全運(yùn)營(yíng)模式，使分析師能夠大規(guī)模開發(fā)部署專用 AI 智能體，依托 Nemotron 模型打造可信賴的企業(yè)級(jí)安全防護(hù)體系。

DataRobot 將 Nemotron 作為在其與 NVIDIA 合作開發(fā)的 Agent Workforce Platform 上大規(guī)模訓(xùn)練、定制和管理 AI 智能體的開放基礎(chǔ)平臺(tái)。該解決方案可在本地、混合及多云環(huán)境中建立、運(yùn)營(yíng)和管理一支功能齊全的 AI 智能體團(tuán)隊(duì)。

ServiceNow 今年早些時(shí)候與 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。該模型使用兩家公司的數(shù)據(jù)進(jìn)行后訓(xùn)練，專門用于執(zhí)行實(shí)時(shí)工作流，并且能以更小規(guī)模提供先進(jìn)的推理，使其更快、更高效并且兼具經(jīng)濟(jì)效益。

倫敦大學(xué)學(xué)院主導(dǎo)的主權(quán) AI 項(xiàng)目 UK-LLM 使用 Nemotron 開源技術(shù)和數(shù)據(jù)集開發(fā)了英語(yǔ)與威爾士語(yǔ) AI 推理模型。

NVIDIA 還將從開發(fā) Nemotron 獲得的洞察，應(yīng)用于下一代系統(tǒng)設(shè)計(jì)，例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型領(lǐng)域的最新創(chuàng)新成果例如精度縮減、稀疏運(yùn)算、新型注意力機(jī)制、優(yōu)化算法等正在重塑 GPU 架構(gòu)。

例如，使用 Nemotron 開發(fā)的新數(shù)據(jù)格式 NVFP4 在大語(yǔ)言模型 (LLM) 訓(xùn)練中每個(gè)參數(shù)僅用 4 位存儲(chǔ)。這項(xiàng)突破性進(jìn)展大大降低了能耗，正在影響著未來(lái) NVIDIA 系統(tǒng)架構(gòu)的設(shè)計(jì)方向。

NVIDIA 還借助整個(gè) AI 社區(qū)開發(fā)的開放技術(shù)優(yōu)化 Nemotron。

阿里巴巴 Qwen 開源模型提供的數(shù)據(jù)增強(qiáng)方案優(yōu)化了 Nemotron 的預(yù)訓(xùn)練與后訓(xùn)練數(shù)據(jù)集。其最新 Qwen3-Next 架構(gòu)突破了長(zhǎng)上下文 AI 的技術(shù)邊界。該模型融合了 NVIDIA 研究中心與麻省理工學(xué)院共同開發(fā)的門控增量網(wǎng)絡(luò) (Gated Delta Networks)。

作為 AI 推理領(lǐng)域的先驅(qū)，DeepSeek R1 推動(dòng)了 Nemotron 數(shù)學(xué)、代碼與推理開源數(shù)據(jù)集的開發(fā)，這些數(shù)據(jù)集可用于訓(xùn)練模型掌握思考能力。

OpenAI 的 gpt-oss 開源權(quán)重模型具有出色的推理、數(shù)學(xué)和工具調(diào)用能力，憑借其可調(diào)節(jié)的推理設(shè)置，可用于強(qiáng)化 Nemotron 后訓(xùn)練數(shù)據(jù)集。

Llama-Nemotron 開放模型系列以 Meta 的 Llama 開放模型集合為基礎(chǔ)，并借助 Nemotron 數(shù)據(jù)集和方法獲得了先進(jìn)的推理能力。

您可在 Hugging Face 上使用 NVIDIA Nemotron 模型與數(shù)據(jù)，來(lái)訓(xùn)練和定制您自己的 AI 模型與智能體，或在 OpenRouter 上免費(fèi)試用模型。使用 NVIDIA RTX PC 的開發(fā)者可通過(guò) llama.cpp 框架獲取 Nemotron。

Hugging Face：

https://huggingface.co/nvidia/collections

OpenRouter：

https://openrouter.ai/nvidia

llama.cpp：

https://github.com/ggml-org/llama.cpp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.