網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

以小身材融入場(chǎng)景，用大算力贏戰(zhàn)AI！聯(lián)想PGX工作站，做AI時(shí)代的小巨人

2026-02-27 16:13:10　來源: 開源中國

廣東舉報(bào)

分享至

引子：

無論是2026年伊始的AI應(yīng)用入口爭(zhēng)奪戰(zhàn)，還是近期業(yè)內(nèi)爆火OpenClaw（原Clawdbot/Moltbot）項(xiàng)目都預(yù)示著，AI技術(shù)正在進(jìn)入廣泛的生產(chǎn)性落地階段。由此，行業(yè)的發(fā)展側(cè)重點(diǎn)也將從過往的大小模型訓(xùn)練/微調(diào)轉(zhuǎn)型為“訓(xùn)推并重+應(yīng)用爆發(fā)”。換言之，如何利用過往積累的AI技術(shù)成果，實(shí)現(xiàn)快速開發(fā)、快速迭代將成為組織發(fā)展的新風(fēng)口。而在這一階段，開發(fā)者也將扮演越來越重要的角色。

那么，AI時(shí)代的開發(fā)者需要怎樣的設(shè)備來提質(zhì)增效呢？在算力為王的背景下，過往那種一臺(tái)電腦、一杯咖啡就能“改變世界”的開發(fā)場(chǎng)景還能復(fù)現(xiàn)嗎？

一封寫給AI開發(fā)者的情書

開發(fā)者是個(gè)極為廣泛的群體，既包含大中小企業(yè)里的全職軟件工程團(tuán)隊(duì)，也包括高教等場(chǎng)景中廣泛存在的各類實(shí)驗(yàn)室、學(xué)術(shù)小組。

對(duì)于AI開發(fā)者而言，算力集群和8卡服務(wù)器雖然性能強(qiáng)勁，但它們太大、太重、太貴、太遠(yuǎn)、太難配置，很難完全滿足快速開發(fā)、敏捷開發(fā)的需求；而傳統(tǒng)PC又因?yàn)锳I算力和顯存的不足而無法支撐工作。

面對(duì)時(shí)代風(fēng)口，所有類型的AI開發(fā)者都在期待一臺(tái)既能擁有超強(qiáng)算力和大容量顯存，又能擺在桌面的全新設(shè)備；而這正是聯(lián)想推出ThinkStation PGX AI工作站（以下簡(jiǎn)稱聯(lián)想PGX工作站）的核心目的。

作為一款以全行業(yè)AI開發(fā)者為目標(biāo)用戶的小型化產(chǎn)品，聯(lián)想PGX工作站將磅礴算力濃縮進(jìn)了1升機(jī)箱之中，并且保持了低功耗、低噪音特性。這樣的特性使其可以被部署在各類辦公區(qū)、實(shí)驗(yàn)室、教室及邊緣場(chǎng)景中，適用于各類中小型模型和AI應(yīng)用的推理場(chǎng)景。

為了同時(shí)滿足算力、體積和功耗目標(biāo)，聯(lián)想PGX工作站在1升體積的機(jī)箱內(nèi)搭載了一顆NVIDIA GB10 Grace Blackwell超級(jí)芯片；其不僅集成了20核ARM處理器，更提供了一顆包含6144個(gè)CUDA核心的Blackwell架構(gòu)GPU。在FP4精度下，聯(lián)想PGX工作站可以提供1 PFlops的峰值算力，且功耗不足240瓦。

同時(shí)為了滿足大模型等應(yīng)用的需求，聯(lián)想PGX工作站還集成了高達(dá)128GB的LPDDR5x統(tǒng)一內(nèi)存，讓AI應(yīng)用不會(huì)輕易“爆顯存”。

在此基礎(chǔ)上，聯(lián)想PGX工作站還能借助內(nèi)置的NVIDIA ConnectX-7智能網(wǎng)卡組建雙機(jī)集群，繼而實(shí)現(xiàn)算力和統(tǒng)一內(nèi)存容量的倍增，讓用戶可以輕松應(yīng)對(duì)更大規(guī)模的應(yīng)用。而小體積+低功耗+靜音的設(shè)計(jì)也讓這種雙機(jī)集群的升級(jí)方式絲毫不會(huì)影響其易部署的核心特性。

聯(lián)想ThinkStation PGX QSFP Link Cable

由于工作站內(nèi)部的算力硬件均來自NVIDIA，因此工作站在軟件層面也保持了對(duì)CUDA生態(tài)的完整兼容，可有效避免“一次開發(fā)，到處調(diào)試優(yōu)化”的尷尬局面，讓開發(fā)者編寫的模型和應(yīng)用既能在廣泛的應(yīng)用場(chǎng)景中獲得應(yīng)用，也無需擔(dān)心后期切換生態(tài)所帶來的各類隱性成本。

基于這些核心特性，我們便能總結(jié)聯(lián)想PGX工作站的核心特性：

用強(qiáng)大的本地算力提升開發(fā)者的工作效率；

用小巧的體積和更低的功耗、噪音來提升工作站在各類場(chǎng)景中的適應(yīng)性；

用先進(jìn)網(wǎng)絡(luò)提升硬件和算力的可擴(kuò)展性；

用更主流的技術(shù)生態(tài)來構(gòu)建教學(xué)-開發(fā)-應(yīng)用之間的一致性。

而擁有這些典型特性的聯(lián)想PGX工作站正是開發(fā)者群體在開發(fā)、研究、教育教學(xué)等場(chǎng)景中所期待的新一代AI硬件，是聯(lián)想對(duì)AI“短平快”理念的絕佳詮釋。

小巧，才能融入所有場(chǎng)景在場(chǎng)景中發(fā)揮價(jià)值

聯(lián)想PGX工作站形態(tài)與各類工控機(jī)相仿，體積僅為1升左右（15*15*5.05厘米），能夠輕松融入辦公室桌面、實(shí)驗(yàn)室、生產(chǎn)車間等所有環(huán)境，作為中小型模型推理和AI應(yīng)用開發(fā)等AI業(yè)務(wù)流的算力核心。

在企業(yè)辦公場(chǎng)景中，聯(lián)想PGX工作站可以放置在辦公桌上，連接鍵鼠和顯示器，作為AI程序的開發(fā)和調(diào)試終端來使用；其安靜的運(yùn)行效果完全不會(huì)影響辦公區(qū)的正常辦公環(huán)境。又或者，多名用戶可以通過虛擬桌面、命令行等方式遠(yuǎn)程訪問聯(lián)想PGX工作站，獲得更便利的使用體驗(yàn)。

在制造業(yè)場(chǎng)景中，聯(lián)想PGX工作站可以像所有工控機(jī)一樣，部署在產(chǎn)線之中，基于計(jì)算機(jī)視覺模型來成為探傷和缺陷識(shí)別功能的算力核心。憑借出色的制造工藝和嚴(yán)格的質(zhì)量測(cè)試，聯(lián)想PGX工作站能夠在嚴(yán)苛的工作環(huán)境中保持穩(wěn)定。

在高校和實(shí)驗(yàn)室場(chǎng)景中，聯(lián)想PGX工作站則能憑借更高的性價(jià)比和完善的售后服務(wù)成為實(shí)驗(yàn)室、學(xué)術(shù)小組等的共享算力核心，在繁重的教學(xué)和研究工作中發(fā)揮持久價(jià)值。

原汁原味的生態(tài)，開箱即用的體驗(yàn)

1. 聯(lián)想PGX工作站外觀

聯(lián)想PGX工作站整體外觀是一個(gè)硬朗的“方盒子”。機(jī)身正面是蜂巢形態(tài)的進(jìn)氣格柵以及ThinkStation系列銘文和PGX的產(chǎn)品名稱，灰+黑的配色有著明確的商務(wù)屬性簡(jiǎn)潔干練，能毫不違和地與各種商務(wù)場(chǎng)景融為一體。

工作站所有接口均在機(jī)身背面，從左至右分別是兩個(gè)200G QSFP網(wǎng)絡(luò)模塊接口，一個(gè)10Gb RJ-45網(wǎng)線接口，一個(gè)HDMI 2.1a視頻輸出口，4個(gè)USB TYPE-C 20G接口，以及一個(gè)電源按鈕。

小巧體積+干練設(shè)計(jì)+豐富接口使得聯(lián)想PGX工作站既能在外型層面提升與各類場(chǎng)景的適應(yīng)性，又能滿足實(shí)際開發(fā)和教育教學(xué)過程中用戶對(duì)連接性的多樣化需求。

2. 聯(lián)想PGX工作站硬件配置軟硬件配置

硬件層面，聯(lián)想PGX工作站不僅用20核CPU+Blackwell GPU+128G統(tǒng)一內(nèi)存的配置將1升工作站的算力水平推向了新高度，更借助兩個(gè)支持RDMA和RoCE功能的200G QSFP網(wǎng)絡(luò)模塊保證了雙機(jī)集群的網(wǎng)絡(luò)帶寬，避免了網(wǎng)絡(luò)擁塞所帶來的潛在性能損失。

在軟件層面，工作站則通過預(yù)裝的全套CUDA環(huán)境、集成式IDE開發(fā)環(huán)境和硬件監(jiān)控Dashboard做到了原汁原味和開箱即用，能大幅縮短開發(fā)者和教育用戶的配置和準(zhǔn)備時(shí)間，進(jìn)一步降低了AI工作站的使用門檻。

聯(lián)想PGX工作站，全能的AI體驗(yàn)

我們將通過Ollama、基于ComfyUI的Stable Diffusion和Wan系列模型、ResNet算法等環(huán)節(jié)來體驗(yàn)聯(lián)想PGX工作站在各類AI應(yīng)用中的性能表現(xiàn)。

大語言模型

使用Ollama來部署各類主流模型，使用“200字簡(jiǎn)述企業(yè)為什么需要AI”作為提示詞，上下文長度設(shè)置為2K，來測(cè)試不同大模型的每秒token生成量、首token延遲、統(tǒng)一內(nèi)存占用情況，以及統(tǒng)一內(nèi)存中的顯存占用。

Qwen3:4b

在很多邊緣場(chǎng)景常用的Qwen3:4b模型中，聯(lián)想PGX工作站能夠?qū)崿F(xiàn)67.59 token/s的性能，首token延遲為27.3ms；此時(shí)，統(tǒng)一內(nèi)存占用量為10.42GB（含操作系統(tǒng)占用），其中顯存占用量為3.2GB。

Qwen3:14b

Qwen3:14b是一款中體量模型，已經(jīng)能夠承擔(dān)不少復(fù)雜的AIGC任務(wù)并作為AI Agent的基礎(chǔ)參與業(yè)務(wù)流應(yīng)用。在運(yùn)行該模型時(shí)，聯(lián)想PGX工作站能夠?qū)崿F(xiàn)20.58 token/s的性能，首token延遲為245.5ms；此時(shí)，統(tǒng)一內(nèi)存占用量為17GB（含操作系統(tǒng)占用），其中顯存占用量為9.4GB。

DeepSeek-r1:32B

作為風(fēng)光無兩的開源大模型系列產(chǎn)品，DeepSeek已經(jīng)成為很多用戶切入大模型賽道的基石。而在中等體量的32B模型中，聯(lián)想PGX工作站能夠?qū)崿F(xiàn)9.55 token/s的性能，首token延遲為156.7ms；此時(shí)，統(tǒng)一內(nèi)存占用量為26.79GB（含操作系統(tǒng)占用），其中顯存占用量為20GB。

DeepSeek-r1:70B

70B大模型是各類高精度、高復(fù)雜度場(chǎng)景的理想選擇，不少專業(yè)領(lǐng)域大模型、內(nèi)容創(chuàng)作大模型都是基于70B的開源模型微調(diào)而來。而在DeepSeek-r1:70B模型的測(cè)試中，聯(lián)想PGX工作站能夠?qū)崿F(xiàn)4.08 token/s的性能，首token延遲為882.9ms；此時(shí)，統(tǒng)一內(nèi)存占用量為48.91GB（含操作系統(tǒng)占用），其中顯存占用量為41.7GB。

Qwen3:30b-A3B

Qwen3:30b-A3B是一款經(jīng)過Q4量化的MoE模型，雖然參數(shù)總量達(dá)到了30B，但同時(shí)激活的參數(shù)只有3B，能夠很好地平衡精度和性能。在這款模型的測(cè)試中，聯(lián)想PGX工作站能夠?qū)崿F(xiàn)74.08 token/s的性能，比4B模型還要高，首token延遲為136.07ms；此時(shí)，統(tǒng)一內(nèi)存占用量為24.67GB（含操作系統(tǒng)占用），其中顯存占用量為18.2GB。

小結(jié)：

從以上不同參數(shù)量的多款大模型測(cè)試中我們能夠發(fā)現(xiàn)，無論是4B的“小模型”還是70B的“大模型”，其統(tǒng)一內(nèi)存占用量始終沒有超過50GB，都不會(huì)在聯(lián)想PGX工作站上出現(xiàn)“爆顯存”的現(xiàn)象。而在MoE技術(shù)的加持下，聯(lián)想PGX工作站則可在保證性能的前提下，挑戰(zhàn)更大參數(shù)量的模型推理應(yīng)用。

此外，由于聯(lián)想PGX工作站預(yù)裝了NVIDIA CUDA Toolkit、NVIDIA Container Toolkit等一系列實(shí)用工具，因此在建立ollama測(cè)試環(huán)境時(shí)只需簡(jiǎn)單拉取對(duì)應(yīng)鏡像即可實(shí)現(xiàn)對(duì)GPU的完整調(diào)用，而無需再進(jìn)行額外的編譯或調(diào)試。此時(shí)，NVIDIA Dashboard的實(shí)時(shí)監(jiān)控也顯示，在通過ollama加載大模型時(shí)，GPU使用率能夠輕松維持在95%左右，不會(huì)出現(xiàn)GPU閑置的情況。

換言之，無論在性能、統(tǒng)一內(nèi)存容量還是在部署的簡(jiǎn)易程度方面，聯(lián)想PGX工作站都能滿足開發(fā)者群體快速部署、快速應(yīng)用的需求。而由此節(jié)省下來的時(shí)間和資金更是AI時(shí)代的珍貴資源。

文生圖、文生視頻大模型

通過ComfyUI加載各類文生圖、文生視頻大模型和對(duì)應(yīng)的工作模版來測(cè)試聯(lián)想PGX工作站在對(duì)應(yīng)場(chǎng)景中的內(nèi)容生成時(shí)間。

Stable Diffusion 3.5文生圖大模型

在文生圖測(cè)試中，我們使用ComfyUI加載SD3.5_large_fp8_scaled模型（經(jīng)過FP8量化，參數(shù)量約為8B）和默認(rèn)模板來生成圖像。關(guān)鍵詞如下：

正向prompt：a bottle with a pink and red galaxy inside it on top of a wooden table on a table in the middle of a modern kitchen with a window to the outdoors mountain range bright sun clouds forest

負(fù)向prompt：none

在這一設(shè)置下，聯(lián)想PGX工作站生成4張512*512圖片的總耗時(shí)為30.58秒；運(yùn)行時(shí)統(tǒng)一內(nèi)存占用量為24.15GB，其中14.55GB被用作顯存。

Wan 2.2文生視頻大模型

在文生視頻測(cè)試中，我們同樣使用ComfyUI加載Wan2.2 14B FP8文生視頻模型，以640*480分辨率和24FPS生成一段5秒鐘的視頻。關(guān)鍵詞如下：

正向prompt：Beautiful young European woman with honey blonde hair gracefully turning her head back over shoulder, gentle smile, bright eyes looking at camera. Hair flowing in slow motion as she turns. Soft natural lighting, clean background, cinematic slow-motion portrait

負(fù)向prompt：色調(diào)艷麗，過曝，靜態(tài)，細(xì)節(jié)模糊不清，字幕，風(fēng)格，作品，畫作，畫面，靜止，整體發(fā)灰，最差質(zhì)量，低質(zhì)量，JPEG壓縮殘留，丑陋的，殘缺的，多余的手指，畫得不好的手部，畫得不好的臉部，畸形的，毀容的，形態(tài)畸形的肢體，手指融合，靜止不動(dòng)的畫面，雜亂的背景，三條腿，背景人很多，倒著走，NSFW

聯(lián)想PGX工作站全程耗時(shí)3分49秒。生成過程中統(tǒng)一內(nèi)存占用量72.64GB，其中53.8GB被用作顯存。

小結(jié)：

常見的文生圖大模型對(duì)于聯(lián)想PGX工作站已是“小菜一碟”。而對(duì)于要求更高的Wan2.2 14B FP8文生視頻模型，PGX工作站也同樣舉重若輕；77G的統(tǒng)一內(nèi)存用量也僅達(dá)到了工作站內(nèi)存容量的60%。要知道過去只有使用全塔機(jī)箱和頂級(jí)GPU的大型工作站才能剛好滿足Wan2.2 14B模型對(duì)顯存的需求，而現(xiàn)在聯(lián)想PGX工作站則把這一能力直接濃縮在了1升機(jī)箱之內(nèi)，放在了開發(fā)者的桌面，不得不感嘆技術(shù)進(jìn)步的魅力。

ResNet50測(cè)試

在使用聯(lián)想PGX工作站通過ResNet50模型進(jìn)行圖像識(shí)別時(shí)，模型成功識(shí)別出了上傳的車輛照片為福特T型，耗時(shí)僅為455ms。此時(shí)統(tǒng)一內(nèi)存占用為7.5GB，其中顯存占用僅為400MB左右。

小結(jié)：

使用未經(jīng)量化和細(xì)致優(yōu)化的標(biāo)準(zhǔn)ResNet50模型進(jìn)行圖像識(shí)別時(shí)，聯(lián)想PGX工作站已經(jīng)表現(xiàn)出了極致的性能。這意味著在經(jīng)過詳細(xì)優(yōu)化之后，工作站的算力水平已經(jīng)能夠滿足各類生產(chǎn)制造類用戶在產(chǎn)品缺陷識(shí)別、質(zhì)量監(jiān)控等邊緣場(chǎng)景中的實(shí)際生產(chǎn)需求。而工作站本身小體積、低功耗的設(shè)計(jì)也進(jìn)一步增加了其在邊緣場(chǎng)景中的應(yīng)用潛力。

功耗溫度及噪音

在22攝氏度、30分貝底噪的安靜室內(nèi)：

待機(jī)空載狀態(tài)下，聯(lián)想PGX工作站（含適配器）功耗僅為40瓦，機(jī)身頂部中間位置的溫度為26.4攝氏度，而60厘米距離的人位噪音也被30分貝的環(huán)境底噪所完全掩蓋。

而在滿載情況下，聯(lián)想PGX工作站（含適配器）功耗也僅為190瓦，機(jī)身頂部中間位置的溫度為29.1攝氏度，60厘米距離的人位噪音為36.5分貝。

總結(jié)：桌面上的微型AI超算，開發(fā)者手中的AI神器

經(jīng)過文生文、文生圖、文生視頻、AI視覺等多維度的測(cè)試，我們可以說，將聯(lián)想PGX工作站絕對(duì)是一款能擺上桌面的微型AI超算。對(duì)于開發(fā)者而言，聯(lián)想PGX工作站則滿足了其對(duì)設(shè)備的幾乎全部想象。

實(shí)際測(cè)試過程中，筆者也充分感受到了聯(lián)想PGX工作站的強(qiáng)大。20核Grace處理器和Blackwell架構(gòu)GPU的組合表現(xiàn)優(yōu)秀，在同時(shí)運(yùn)行多個(gè)容器并持續(xù)重負(fù)載時(shí)依舊能保持基礎(chǔ)操作的流暢。這意味著開發(fā)者可以一邊跑大模型，一邊寫代碼，效率更高。

同時(shí)，巨大的128G統(tǒng)一內(nèi)存也完全超過了“夠用”層級(jí)，使得筆者可以直接跳過對(duì)模型參數(shù)量和顯存需求的各類換算，直接“挑大的用，挑好的用”。而對(duì)于開發(fā)者來說，更高的統(tǒng)一內(nèi)存容量也能減少對(duì)比選型時(shí)的各種限制，以及頻繁的模型加載/卸載過程。

另一方面，聯(lián)想PGX工作站超靜音表現(xiàn)則完全超出了筆者的預(yù)期。即使身處30分貝底噪的安靜室內(nèi)（相當(dāng)于夜間臥室的噪音水平），低負(fù)載的聯(lián)想PGX工作站也能完全融入底噪，無法被人耳察覺。即便滿負(fù)載運(yùn)行，36.5分貝的噪音水平也要比絕大多數(shù)辦公室、實(shí)驗(yàn)室的正常底噪要低，更是多數(shù)工作站無法企及的水平。如果AI開發(fā)者和企事業(yè)單位想構(gòu)建一個(gè)更安靜優(yōu)雅的開發(fā)辦公環(huán)境，聯(lián)想PGX工作站是絕對(duì)的不二之選。

此外，聯(lián)想PGX工作站預(yù)裝的完整CUDA環(huán)境也讓整個(gè)測(cè)試流程異常順利。在運(yùn)行Ollama、ComfyUI等流行應(yīng)用時(shí)，只需拉取ARM版的官方或社區(qū)鏡像就能順利完成測(cè)試，GPU也能跑滿負(fù)載，不會(huì)遇到第三方系統(tǒng)中常見的CUDA版本不對(duì)、環(huán)境依賴缺失、GPU無法啟用等現(xiàn)象，節(jié)省了大量調(diào)試和重編譯時(shí)間。而這種開箱即用的體驗(yàn)對(duì)于開發(fā)者和各類AI項(xiàng)目來說也是提質(zhì)增效的關(guān)鍵一環(huán)。

作為大廠精品，PGX工作站也背靠著聯(lián)想的龐大產(chǎn)能和頂尖服務(wù)能力，而這也讓聯(lián)想PGX工作站工作站成為了一款有設(shè)計(jì)、有技術(shù)、有供應(yīng)、有保障的AI工作站標(biāo)桿；不僅適合企業(yè)、高校等各類單位為開發(fā)者批量采購，更是組織擁抱AI新時(shí)代的全新著力點(diǎn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.