Nemotron 開源技術(shù)能夠幫助開發(fā)者與企業(yè)構(gòu)建強(qiáng)大的通用和專用智能系統(tǒng)。
![]()
開放技術(shù)可供開發(fā)者與企業(yè)自由使用、修改和創(chuàng)新,貫穿了從互聯(lián)網(wǎng)誕生到云計(jì)算早期的每次重大技術(shù)變革。AI 也不該例外。
因此,NVIDIA Nemotron 多模態(tài) AI 模型、數(shù)據(jù)集和技術(shù)已向公眾全面開放。Nemotron 可用于本地個(gè)人電腦到企業(yè)級(jí)系統(tǒng)上的研究與商業(yè)用途,提供了一個(gè)開放的 AI 應(yīng)用構(gòu)建基礎(chǔ)平臺(tái)。開發(fā)者可通過(guò) GitHub、Hugging Face 和 OpenRouter 使用。
通過(guò) Nemotron,開發(fā)者、初創(chuàng)公司及各種規(guī)模的企業(yè)都能使用基于透明開源訓(xùn)練數(shù)據(jù)訓(xùn)練而成的模型。此外,Nemotron 還提供加速工具,覆蓋從定制到部署的全開發(fā)流程。
由于該技術(shù)的公開透明性,使用者能夠理解模型的運(yùn)作機(jī)制并信任其輸出結(jié)果。
憑借其在通用智能與代理式 AI 推理方面的能力,以及對(duì)特定 AI 用例的適應(yīng)性,Nemotron 如今已被制造、醫(yī)療、教育及零售等行業(yè)的 AI 創(chuàng)新者與領(lǐng)導(dǎo)者廣泛使用。
什么是 NVIDIA Nemotron?
NVIDIA Nemotron 是一套專為提高 AI 開發(fā)全流程效率而打造的開源 AI 技術(shù)集合,包含:
- 多模態(tài)模型:以開放檢查點(diǎn)形式交付的先進(jìn) AI 模型,在研究生級(jí)別科學(xué)推理、高等數(shù)學(xué)、編碼、指令執(zhí)行、工具調(diào)用、視覺(jué)推理方面表現(xiàn)出色。
- 預(yù)訓(xùn)練、后訓(xùn)練及多模態(tài)數(shù)據(jù)集:精心篩選的文本、圖像和視頻數(shù)據(jù)集合,可用于訓(xùn)練 AI 模型掌握語(yǔ)言、數(shù)學(xué)和問(wèn)題解決等技能。
- 數(shù)值精度算法和方案:先進(jìn)的精度技術(shù),能在保障答案準(zhǔn)確性的同時(shí),大幅提升 AI 運(yùn)行速度并降低成本。
- 用于高效擴(kuò)展 GPU 集群上訓(xùn)練規(guī)模的系統(tǒng)軟件:這是一系列經(jīng)過(guò)優(yōu)化的軟件與框架,可在 NVIDIA GPU 上實(shí)現(xiàn)大規(guī)模訓(xùn)練與推理加速,適配超大模型的需求。
- 后訓(xùn)練方法與軟件:提高 AI 智能水平、安全性和特定任務(wù)處理能力的微調(diào)步驟。
NVIDIA 致力于為開發(fā)者、行業(yè)領(lǐng)導(dǎo)者和公共及私營(yíng)領(lǐng)域的 AI 基礎(chǔ)設(shè)施構(gòu)建者提供開放、透明且自適應(yīng)的 AI 平臺(tái),而 Nemotron 正是該戰(zhàn)略的重要組成部分。
![]()
通用智能與專用智能有何區(qū)別?
NVIDIA 開發(fā) Nemotron 是為了提升通用智能的能力(包括 AI 推理能力),同時(shí)加速專業(yè)化進(jìn)程,進(jìn)而幫助全球企業(yè)使用 AI 解決行業(yè)難題。
通用智能是指基于海量公開數(shù)據(jù)集訓(xùn)練而成、可執(zhí)行廣泛任務(wù)的模型,是解決各類問(wèn)題和執(zhí)行各類推理任務(wù)必不可少的引擎。專用智能學(xué)習(xí)某一行業(yè)或組織機(jī)構(gòu)特有的語(yǔ)言、流程及優(yōu)先事項(xiàng),使 AI 模型能夠適應(yīng)特定的現(xiàn)實(shí)應(yīng)用。
要實(shí)現(xiàn) AI 在各行業(yè)的規(guī)模化應(yīng)用,兩者缺一不可。
因此,Nemotron 提供了針對(duì)多種計(jì)算平臺(tái)優(yōu)化的預(yù)訓(xùn)練基礎(chǔ)模型,以及 NVIDIA NeMo 和 NVIDIA Dynamo 等工具,以將通用 AI 模型轉(zhuǎn)化為定制化的專用智能模型。
開發(fā)者與企業(yè)如何使用 Nemotron?
NVIDIA 開發(fā) Nemotron 的目標(biāo)是加快全球開發(fā)者的工作進(jìn)程,并且為未來(lái) AI 系統(tǒng)設(shè)計(jì)指明方向。
無(wú)論是研究機(jī)構(gòu)還是初創(chuàng)公司和跨國(guó)企業(yè),開發(fā)者都需要靈活、可信的 AI。Nemotron 提供了構(gòu)建、定制和集成 AI 的工具,適用于幾乎所有領(lǐng)域。
- CrowdStrike 正將面向安全團(tuán)隊(duì)的 Charlotte AI AgentWorks 無(wú)代碼平臺(tái)與 Nemotron 集成,幫助推動(dòng)代理式生態(tài)系統(tǒng)的發(fā)展并保護(hù)其安全。此次合作重新定義了安全運(yùn)營(yíng)模式,使分析師能夠大規(guī)模開發(fā)部署專用 AI 智能體,依托 Nemotron 模型打造可信賴的企業(yè)級(jí)安全防護(hù)體系。
- DataRobot 將 Nemotron 作為在其與 NVIDIA 合作開發(fā)的 Agent Workforce Platform 上大規(guī)模訓(xùn)練、定制和管理 AI 智能體的開放基礎(chǔ)平臺(tái)。該解決方案可在本地、混合及多云環(huán)境中建立、運(yùn)營(yíng)和管理一支功能齊全的 AI 智能體團(tuán)隊(duì)。
- ServiceNow 今年早些時(shí)候與 NVIDIA 合作推出了 Apriel Nemotron 15B 模型。該模型使用兩家公司的數(shù)據(jù)進(jìn)行后訓(xùn)練,專門用于執(zhí)行實(shí)時(shí)工作流,并且能以更小規(guī)模提供先進(jìn)的推理,使其更快、更高效并且兼具經(jīng)濟(jì)效益。
- 倫敦大學(xué)學(xué)院主導(dǎo)的主權(quán) AI 項(xiàng)目 UK-LLM 使用 Nemotron 開源技術(shù)和數(shù)據(jù)集開發(fā)了英語(yǔ)與威爾士語(yǔ) AI 推理模型。
NVIDIA 還將從開發(fā) Nemotron 獲得的洞察,應(yīng)用于下一代系統(tǒng)設(shè)計(jì),例如 Grace Blackwell、Vera Rubin 和 Feynman 等。AI 模型領(lǐng)域的最新創(chuàng)新成果例如精度縮減、稀疏運(yùn)算、新型注意力機(jī)制、優(yōu)化算法等正在重塑 GPU 架構(gòu)。
例如,使用 Nemotron 開發(fā)的新數(shù)據(jù)格式 NVFP4 在大語(yǔ)言模型 (LLM) 訓(xùn)練中每個(gè)參數(shù)僅用 4 位存儲(chǔ)。這項(xiàng)突破性進(jìn)展大大降低了能耗,正在影響著未來(lái) NVIDIA 系統(tǒng)架構(gòu)的設(shè)計(jì)方向。
NVIDIA 還借助整個(gè) AI 社區(qū)開發(fā)的開放技術(shù)優(yōu)化 Nemotron。
- 阿里巴巴 Qwen 開源模型提供的數(shù)據(jù)增強(qiáng)方案優(yōu)化了 Nemotron 的預(yù)訓(xùn)練與后訓(xùn)練數(shù)據(jù)集。其最新 Qwen3-Next 架構(gòu)突破了長(zhǎng)上下文 AI 的技術(shù)邊界。該模型融合了 NVIDIA 研究中心與麻省理工學(xué)院共同開發(fā)的門控增量網(wǎng)絡(luò) (Gated Delta Networks)。
- 作為 AI 推理領(lǐng)域的先驅(qū),DeepSeek R1 推動(dòng)了 Nemotron 數(shù)學(xué)、代碼與推理開源數(shù)據(jù)集的開發(fā),這些數(shù)據(jù)集可用于訓(xùn)練模型掌握思考能力。
- OpenAI 的 gpt-oss 開源權(quán)重模型具有出色的推理、數(shù)學(xué)和工具調(diào)用能力,憑借其可調(diào)節(jié)的推理設(shè)置,可用于強(qiáng)化 Nemotron 后訓(xùn)練數(shù)據(jù)集。
- Llama-Nemotron 開放模型系列以 Meta 的 Llama 開放模型集合為基礎(chǔ),并借助 Nemotron 數(shù)據(jù)集和方法獲得了先進(jìn)的推理能力。
您可在 Hugging Face 上使用 NVIDIA Nemotron 模型與數(shù)據(jù),來(lái)訓(xùn)練和定制您自己的 AI 模型與智能體,或在 OpenRouter 上免費(fèi)試用模型。使用 NVIDIA RTX PC 的開發(fā)者可通過(guò) llama.cpp 框架獲取 Nemotron。
Hugging Face:
https://huggingface.co/nvidia/collections
OpenRouter:
https://openrouter.ai/nvidia
llama.cpp:
https://github.com/ggml-org/llama.cpp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.