337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<sup id="2yyyy"><ul id="2yyyy"></ul></sup>

<sup id="2yyyy"></sup>

<tfoot id="2yyyy"></tfoot>

<sup id="2yyyy"><cite id="2yyyy"></cite></sup>

<sup id="2yyyy"></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

成本低20倍速度高10倍，“芯片即模型”打破GPU神話？（附論文原文）

2026-02-23 08:35:09　來源: AI先鋒官

北京舉報

0

分享至

兩天前，AI芯片創業公司 Taalas 發布了一篇頗具宣言意味的文章：《The Path to Ubiquitous AI》（《通往無處不在的 AI 之路》，原文附后）

核心觀點只有一句話：AI 要真正普及，必須解決兩個問題，延遲和成本。

該文指出，如今的AI基礎設施正在走向一種“數據中心+電廠”的畸形路徑。

房間大小的服務器、數百千瓦功耗、液冷系統、HBM堆疊、復雜封裝、成公里長的電纜。

這被認為不是AI的終局。

因為真正普及的技術，必須變得更簡單、更快、更便宜。

為此，Taalas提出一個極端方向，為每一個模型，生產專用芯片。

也就是說，不搞通用 GPU，而是“模型即芯片”。

為此， Taalas 開發了一個平臺，可以將任何 AI 模型轉化為定制硅芯片。“從收到一個全新的模型開始，只需兩個月，就能將其硬件化”。

據介紹，Taalas的核心開發理念有三點，即極致專用化、計算與存儲融合，及激進簡潔。

他們發布的首款產品，是硬編碼的 Llama 3.1 8B，性能表現十分搶眼。

據介紹，該產品由 24 人團隊完成，僅花費 3000 萬美元。

比如，17,000 tokens/秒、接近現有方案 10 倍速度、成本降低約 20 倍、功耗降低約 10 倍……

Taalas由此還提出“即時 AI”的概念。

一些資深開發者在 X 上的發帖，“17000 tokens/s…，等待模型思考的時代結束了”。

Basecamp 創始人 DHH 試用后稱，“感覺像作弊一樣快”。

半導體行業投資人 Pierre Lamond 稱，團隊做芯片的經驗業內頂級，認為他們的方向能 1000倍成本改善，從而推動AI成為基礎設施級能力。

Cambrian-AI首席分析師 Karl Freund 在 Forbes 專欄里稱，早期用戶把它的性能形容為“insane（瘋狂）”。

他指出，如果被大規模數據中心采用，可能會改變行業格局。

Freund 的擔憂是，每個模型一顆芯片，那么模型升級是否意味著換硬件？數據中心是否愿意承擔這種不靈活？

因此他認為，模型即芯片方向很有吸引力，但能否成為主流還說不好。

行業媒體 Financial Express分析指出，這種架構更適合穩定、高規模、單模型場景，在多模型頻繁迭代環境中可能受限。

而目前大模型的狀態，更顯然是后者。

但如果未來進入一個“少數基礎模型長期統治”的階段，那GPU是否仍是最優解？

盡管有所爭議，但Taalas在 AI 基礎設方向與架構的探索值得反思。

比如，這是否意味著AI算力可能發生第三次的路線分裂？

第一次分裂，是 CPU → GPU。
深度學習爆發后，通用CPU迅速被淘汰。并行計算取代串行計算，成為基礎設施底座。

NVIDIA 憑借GPU完成市值躍遷，成為AI時代最大贏家。

第二次分裂，是自建GPU → AI 云。

模型越來越大，企業越來越難自己部署，算力被抽象為API。

GPU不再只是硬件，而成為云服務的一部分。

亞馬遜Web Services、微軟 Azure、谷歌 Cloud 、阿里云、字節火山云等，成為 AI 基礎設施代名詞。

第三次分裂，會不會是 Taalas 提出的，模型即芯片？

不再依賴HBM、復雜封裝，也不依賴液冷，不是“更強GPU”，而是“推理專用ASIC的極端版本”。

或者，更本質的，Taalas 路線真正可能改變的，是AI的邊際成本曲線？

以下為Taalas博文原文

《通往無處不在的 AI 之路》

作者：Ljubisa Bajic

許多人相信，AI 確實已經進入真正可用的階段。在一些狹窄領域，它的表現已經超過人類。如果使用得當，它將成為前所未有的人類創造力與生產力放大器。

但它的大規模普及仍然受到兩個關鍵障礙的限制：高延遲和天文級成本。

與語言模型的交互速度遠遠跟不上人類思考的節奏。編程助手可能要思考幾分鐘，這會打斷程序員的心流狀態，限制人與 AI 的高效協作。而自動化的智能體應用需要的是毫秒級響應，而不是按人類節奏慢慢輸出。

在成本方面，部署現代模型需要巨大的工程投入和資本支出：占據整間房間的超級計算機，耗電數百千瓦，依賴液冷、先進封裝、堆疊內存、復雜 I/O，以及成公里的線纜。這最終擴展為城市規模的數據中心園區和配套網絡，帶來極高的運營成本。

雖然當下的趨勢似乎指向一個由數據中心和電廠構成的“反烏托邦未來”，但歷史往往走向另一條路。過去的技術革命，往往始于笨重而夸張的原型，隨后被更實用的突破所取代。

例如 ENIAC——一個充滿真空管和電纜、占據整間房間的龐然大物。它讓人類第一次見識到計算的魔力，但速度慢、成本高、無法擴展。晶體管的出現帶來了快速演進：從工作站、個人電腦到智能手機，最終實現了無處不在的計算，世界并沒有被 ENIAC 式機器所淹沒。

通用計算之所以進入主流，是因為它變得易于制造、速度更快、成本更低。

AI 也必須走同樣的道路。

關于 Taalas

成立于兩年半前，Taalas 開發了一個平臺，可以將任何 AI 模型轉化為定制硅芯片。從收到一個全新的模型開始，只需兩個月，就能將其硬件化。

由此生成的“硬核模型”（Hardcore Models），在速度、成本和功耗方面，相比軟件實現提升一個數量級。

Taalas 的工作基于三大核心原則：

1. 極致專用化

在計算發展史上，深度首款產品由 24 人團隊完成專用化始終是關鍵任務實現極致效率的最佳路徑。

AI 推理是人類面臨過的最重要計算負載之一，也是最適合專用化的領域。

其計算需求推動一個方向：為每一個模型生產最優的專用芯片。

2. 存儲與計算融合

現代推理硬件受到一個人為分割的限制：內存與計算分離，而且運行速度完全不同。

這種分離源于一個長期矛盾：

DRAM 密度更高、成本更低，但訪問片外 DRAM 的速度比片上內存慢數千倍；而計算芯片又無法采用 DRAM 工藝制造。

這種分割帶來了現代推理硬件的大量復雜性：先進封裝、HBM 堆疊、巨大的 I/O 帶寬、不斷上升的功耗，以及液冷系統。

Taalas 打破了這一邊界。通過在單芯片上統一存儲與計算，并達到 DRAM 級密度，其架構實現了前所未有的性能水平。

3. 激進簡化

通過消除存儲與計算的分離，并為每個模型定制芯片，Taalas 從第一性原理重新設計了整個硬件棧。

結果是一個不依賴復雜或前沿工藝的系統：無需 HBM、先進封裝、3D 堆疊、液冷或高速 I/O。

工程上的簡潔，帶來了系統總成本數量級的下降。

首批產品

基于上述理念，Taalas 打造了全球最快、成本和功耗最低的推理平臺。

目前發布的首款產品，是一個硬編碼的 Llama 3.1 8B 模型，既提供聊天演示，也提供推理 API 服務。

這款硅基 Llama 實現：

每用戶 17K tokens/秒
接近當前最先進方案的 10 倍速度
構建成本降低 20 倍
功耗降低 10 倍

之所以選擇 Llama 3.1 8B，是因為它體積適中且開源，便于快速硬化部署。

雖然模型為速度進行了大量硬編碼，但仍支持可配置上下文窗口，并通過 LoRA 進行微調。

第一代芯片采用自定義 3-bit 基礎數據類型，并結合 3-bit 與 6-bit 量化，因此在質量上相較 GPU 基準略有下降。

第二代硅平臺將采用標準 4-bit 浮點格式，在保持高性能的同時改善質量問題。

即將推出的模型

第二個模型將是一個中型推理型 LLM，仍基于第一代 HC1 平臺，預計今年春季進入實驗室并很快上線服務。

隨后，將基于第二代 HC2 平臺制造一個前沿級模型。HC2 具有更高密度和更快執行速度，計劃于冬季部署。

即時 AI，觸手可及

首個模型并非最前沿，但團隊仍以 Beta 形式發布，希望開發者體驗：當 LLM 推理達到亞毫秒級速度、接近零成本時，會帶來什么可能性。

他們相信，這將使許多此前不可行的應用成為現實，并鼓勵開發者探索新的應用場景。

關于團隊與方法

Taalas 的核心團隊規模很小，成員多為合作超過二十年的長期伙伴。團隊增長緩慢，重視專業能力、使命一致性和工程紀律。

實質重于聲勢
工藝重于規模
嚴謹重于冗余

在許多深科技創業公司依靠龐大團隊、巨額融資和市場聲量“圍城式推進”的環境中，Taalas 選擇的是一次精準打擊。

首款產品由 24 人團隊完成，僅使用 3000 萬美元（總融資超過 2 億美元）。這證明：明確目標與專注執行，可以勝過蠻力投入。

未來，團隊將持續開放迭代，盡早發布系統，讓開發者參與驗證與完善。

結語

創新始于對既有假設的質疑，以及對被忽視路徑的探索，這正是 Taalas 選擇的方向。

他們的技術在性能、能效和成本上實現了躍遷式提升，并代表一種不同于主流的架構理念——重新定義 AI 系統的構建與部署方式。

真正的顛覆性技術，最初往往并不熟悉。團隊將致力于推動行業理解并采用這一新范式。

從硬編碼的 Llama 開始，并快速擴展到更強模型，Taalas 正在消除 AI 普及的兩大核心障礙：高延遲與高成本。

他們已經把即時、超低成本的智能交到開發者手中，現在，期待看到人們將用它創造什么。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

2026，國產AI芯片，跨越天塹：從“推理”走向“訓練”

鈦媒體APP 2026-02-25 12:59:31
0 跟貼 0
1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0

黃仁勛的“五層蛋糕”：AI的底層戰爭，是能源戰爭（附全文）

鈦媒體APP 2026-03-11 21:03:21
0 跟貼 0

楊立昆發布史上最“輕”世界模型，單GPU可訓，規劃速度提升48倍

DeepTech深科技 2026-03-24 17:52:42
22 跟貼 22
阿里的AI敘事，多個夸克，差了豆包

鈦媒體APP 2025-10-16 09:12:09
17 跟貼 17

ApdativeNN：建模類人自適應感知機制，突破機器視覺不可能三角

機器之心Pro 2025-11-28 17:15:19
0 跟貼 0

Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0
Echo：預測智能的一小步，通往通用智能的一大步

機器之心Pro 2026-03-30 10:23:07
0 跟貼 0

血洗內存股900億刀的谷歌AI論文，竟涉嫌學術造假

機器之心Pro 2026-03-30 10:50:31
0 跟貼 0
黑馬AI橫掃預測市場！預測未來勝率已超過人類

新智元 2026-03-30 09:36:49
0 跟貼 0
為何這一輪硬科技獨角獸背后，都有美團？

虎嗅APP 2026-03-30 10:49:46
0 跟貼 0
AI驅動產業新周期，多重邏輯共振迎投資機遇

每日經濟新聞 2026-03-18 11:38:14
0 跟貼 0
美官員稱中芯國際已向伊朗軍方提供芯片制造工具外交部回應

鳳凰衛視 2026-03-27 16:38:27
0 跟貼 0
手游發熱、掉幀、閃退，這三類問題的排查路徑，大多數團隊都搞反了

侑虎科技UWA 2026-03-25 19:12:09
0 跟貼 0
內存條價格跳水，內存股集體下跌，內存超級周期見頂了？

華爾街見聞官方 2026-03-30 10:40:05
0 跟貼 0
伊朗窮打法擊潰以色列防線？無人機成本戰改寫中東規則

執筆寫思念 2026-03-28 03:14:31
0 跟貼 0
2萬美元塞下750TOPS算力，小鵬把智駕芯片卷成白菜價

算力游俠 2026-03-30 09:25:02
0 跟貼 0
全國累計器官捐獻志愿登記人數超過733萬

環球網資訊 2026-03-29 12:57:07
17004 跟貼 17004
電動車價格分水嶺：為什么4000元以內熱銷，5500以上就賣不動了？

電動車的那些事兒 2026-03-30 07:35:53
2 跟貼 2
一篇論文砸崩存儲芯片巨頭股價，谷歌干了什么？

量子位 2026-03-28 02:40:37
0 跟貼 0
72小時，前衛防空導彈雙殺：2萬美元成本打下F-18，美軍痛心不已

軍武時間線 2026-03-28 15:53:11
1 跟貼 1
瘋了！游戲本逆天改裝：一顆電阻4090反殺5090！

雷科技 2025-11-11 18:57:46
170 跟貼 170
讓我看看你們的速度

開心就好你管我 2026-03-28 15:42:03
0 跟貼 0
現在我這速度，沒有人能追上我了吧

探索領航員 2026-03-28 13:02:19
1 跟貼 1
方法巨多又不難的題，就是為了考你速度

數學高分老曹 2026-03-28 16:17:10
5 跟貼 5
張雪機車領先4秒拿下WSBK分站賽冠軍

每日經濟新聞 2026-03-30 08:57:15
10 跟貼 10
騎車到底在追求什么？是速度，還是真正的享受？

中國自行車在線 2026-03-30 06:06:59
3 跟貼 3
臺積電赴美建廠后擴建大陸芯片廠，專家怒斥吃相難看

新時代精神 2026-03-29 00:21:48
0 跟貼 0
世貿天階拆了？實為煥新升級，籃球中心謝幕，4K天幕將登場

新京報 2026-03-29 17:11:22
694 跟貼 694
這個鋼琴工具測了18萬次按鍵：快沒用，穩才行

全棧遛狗員 2026-03-30 07:33:59
0 跟貼 0
【文明交通】低速慢行隱患大太原交警解析發警示

錦繡太原 2026-03-30 09:10:03
0 跟貼 0
芯片開源：不屬于任何國家，

獸樓處 2026-03-26 21:47:12
0 跟貼 0
龍蝦硬件能讓電池更健康，支持智能充電器

愛范兒 2026-03-10 04:18:42
0 跟貼 0
下半年的每一場消費電子發布會，都是壞消息

愛范兒 2026-03-30 09:10:21
0 跟貼 0
谷歌發布新型AI內存壓縮技術！全球存儲芯片股集體下挫

時代周報 2026-03-28 08:47:30
0 跟貼 0
AMD蘇姿豐 CES2026主題演講完整版（中文字幕）

智東西 2026-01-06 17:32:10
0 跟貼 0
廢舊手機回收價格“狂飆”！以前幾十塊沒人要，現在幾百塊搶著收！#廢舊手機價格暴漲 #存儲芯片短缺

8099999街頭巷尾 2026-03-27 16:27:34
0 跟貼 0
別再亂種地了！這5種作物才是“賺錢王”成本低好管理種上就豐收

木歌總攻大人 2026-03-30 04:29:07
0 跟貼 0
華為暢享 90系列：麒麟8系芯片，華為史上最大電池！

宅數碼Kael 2026-03-25 22:08:45
3 跟貼 3
印度又官宣自研五代機！17年就憋出個模型，能趕超中美俄嗎？

浩然簡史 2026-03-28 16:39:42
0 跟貼 0

印度求尿素救春耕，欠百億卻裝傻？中國：不還錢一粒不賣

印度求尿素救春耕，欠百億卻裝傻？中國：不還錢一粒不賣

現代小青青慕慕

2026-03-30 09:11:57

三大運營商利潤被抽走15%：國家要錢了，5G故事講完了

三大運營商利潤被抽走15%：國家要錢了，5G故事講完了

字節漫游指南

2026-03-30 10:15:13

李榮浩怒撕單依純恩將仇報自毀前程，離天后王菲距離還差很多原創

李榮浩怒撕單依純恩將仇報自毀前程，離天后王菲距離還差很多原創

李守智

2026-03-29 16:43:23

冰壺世錦賽：中國9-4勝挪威，2勝2負升至第3，將戰日本

冰壺世錦賽：中國9-4勝挪威，2勝2負升至第3，將戰日本

小犙拍客在北漂

2026-03-30 07:30:24

藍莓再次被關注？研究發現：藍莓或可在30小時內清除體內45%因子

藍莓再次被關注？研究發現：藍莓或可在30小時內清除體內45%因子

垚垚分享健康

2026-03-29 11:55:24

光纖招標價格，炸了！

格隆匯

2026-03-29 15:36:36

家里這7樣舊東西別丟！今年漲了80%，比黃金還吃香

家里這7樣舊東西別丟！今年漲了80%，比黃金還吃香

小鹿姐姐情感說

2026-03-29 10:26:08

票房從7.19億暴跌至490萬，金字招牌已崩塌

票房從7.19億暴跌至490萬，金字招牌已崩塌

最美的筆觸

2026-03-29 15:19:58

落難的鳳凰不如雞，多位明星無戲可拍，淪落到給景區打工，太心酸

落難的鳳凰不如雞，多位明星無戲可拍，淪落到給景區打工，太心酸

舊事別提

2026-03-30 04:44:08

日本球迷：韓國足球不應該和日本對比，中國才是你的競爭對手！

日本球迷：韓國足球不應該和日本對比，中國才是你的競爭對手！

邱澤云

2026-03-29 14:48:08

催人淚下！張雪峰常把家鄉高校當避坑指南，當地送挽聯以最高敬意

催人淚下！張雪峰常把家鄉高校當避坑指南，當地送挽聯以最高敬意

火山詩話

2026-03-28 06:26:33

從前的章子怡和現在的章子怡，雖然都很美，但是不同的兩種感覺

從前的章子怡和現在的章子怡，雖然都很美，但是不同的兩種感覺

娛你同歡

2026-03-29 16:55:41

我國原創！全球首張處方，落地

環球網資訊

2026-03-28 16:42:09

善惡有報！逼人民日報怒批、暗諷張雪峰，1300萬網紅終為荒唐買單

善惡有報！逼人民日報怒批、暗諷張雪峰，1300萬網紅終為荒唐買單

觀察鑒娛

2026-03-29 09:24:41

外國小姐姐把旗袍撐的緊繃繃的

飛娛日記

2026-03-30 09:56:38

日本警視廳對強闖我駐日使館不法之徒所屬部隊駐地等展開搜查

日本警視廳對強闖我駐日使館不法之徒所屬部隊駐地等展開搜查

每日經濟新聞

2026-03-29 09:55:30

當眾打臉！曼聯王牌遭圖赫爾無視，直言隊中四人實力遠超他

當眾打臉！曼聯王牌遭圖赫爾無視，直言隊中四人實力遠超他

瀾歸序

2026-03-30 02:59:58

澳門乒乓世界杯賽程：3月30日國乒對陣表，CCTV5直播

澳門乒乓世界杯賽程：3月30日國乒對陣表，CCTV5直播

小犙拍客在北漂

2026-03-29 17:51:00

紅魔終于等對人！貝克漢姆：看卡里克執教的曼聯，比十年都舒服

紅魔終于等對人！貝克漢姆：看卡里克執教的曼聯，比十年都舒服

夜白侃球

2026-03-30 09:09:17

英德同時對美展現立場，特朗普僅剩一條路可走

英德同時對美展現立場，特朗普僅剩一條路可走

史政先鋒

2026-03-30 07:11:46

AIGC大模型及應用精選與評測

467文章數 69關注度

往期回顧全部

科技要聞

DeepSeek“崩了”一夜，仍無法正常使用

頭條要聞

單依純發文道歉"我的錯誤與任何人無關" 李榮浩回應

頭條要聞

單依純發文道歉"我的錯誤與任何人無關" 李榮浩回應

體育要聞

絕殺衛冕冠軍后，他單手指天把勝利獻給父親

娛樂要聞

單依純凌晨發長文道歉！李榮浩再回應

財經要聞

油價沖擊，有些亞洲貨幣先扛不住了！

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

本地

旅游

數碼

公開課

家居要聞

東方法式美學現代簡約

曲線華爾茲現代簡約
傍海而居靜觀蝴蝶海
輕奢堇天府小資情調

本地新聞

在濰坊待了三天，沒遇到一個“濰坊人”

旅游要聞

多地以花為媒創新玩法激活“春日經濟” 沉浸式“賞花打卡”點亮文旅新意

數碼要聞

戴爾推Dell Pro 5 Micro商用迷你主機，采英特爾"PTL"處理器

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<noscript id="yy8yy"></noscript>

<tr id="yy8yy"><blockquote id="yy8yy"></blockquote></tr>

<sup id="yy8yy"><code id="yy8yy"></code></sup>

<sup id="yy8yy"><code id="yy8yy"></code></sup>

<nav id="yy8yy"><code id="yy8yy"></code></nav>