337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

馬斯克說漏嘴了!Claude Opus參數5T,Sonnet 1T

0
分享至

西風 發自 凹非寺
量子位 | 公眾號 QbitAI

哦豁,馬斯克一個“不小心”,把Claude參數抖出來了???

長話短說:Sonnet 1T、Opus 5T。



起因是老馬發帖表示,xAI的Colossus 2超算正在訓練7個模型,其中最大的一款,參數量直接沖到了10萬億。

完整清單:

Imagine V2
2個1萬億(1T)參數的變體模型
2個1.5 萬億(1.5T)參數的變體模型
6萬億(6T)參數模型
10萬億(10T)參數模型

P.S. Colossus 2,就是老馬巨硬計劃(Macrohard)的一部分。據2025年8月披露的信息,Colossus 2已經安裝了119臺風冷式冷水機組,提供約200MW的冷卻能力,足以支持約11萬個GB200 NVL72 GPU。

按照當時規劃,Colossus 2第一階段部署11萬個英偉達GB200 GPU,最終目標是超過55萬個GPU,峰值功率需求預計超過1.1GW。

這次發推文,也是馬斯克為數不多地對外公開Colossus超算的具體訓練計劃。



消息一出,網友開啟好奇寶寶模式,馬斯克也是心情不錯的樣子,看到提問也回復了不少。

比如有人問“訓練一個10T模型,大概要花多久?”,馬斯克說預訓練階段大約需要2個月。



哎,就有這么一段對話出現了。

Grok 4.2的參數量,僅為xAI目前在訓最大模型的5%。也就是5000億(500B)對比10萬億(10T),后者是前者20倍。
Grok 4.2真的是總參數量500B嗎?還是說只是在一個更大的MoE里,激活的參數量是500B億?

面對疑問,老馬又親自回應了:

總參數量就是0.5T(5000億)?,F在的Grok,參數量是Sonnet的一半、Opus的十分之一。以它的規模來說,是非常強的模型。



網友一眼瞄到顯眼信息,這不就是說Sonnet是1T,Opus是5T。

于是有人追問:

純好奇,你(馬斯克)怎么知道Sonnet、Opus大?。?br/>



對此老馬閉麥了,網友提出的點倒不無道理,“頂尖人才在這么幾家公司間流動,似乎也沒什么秘密能藏太久”。



Claude各版本參數,來自網友推測

自打Claude系列模型問世,Anthropic就一直嚴格保密參數規模,不管是Opus還是Sonnet,愣是一點沒披露。

越不說,網友討論得越起勁。

我們用AI總結了一下網友們分析討論的不同版本的Claude參數規模。

你還別說,你還真別說。最新模型Claude 4.6 Sonnet ~1-2T、Claude 4.6 Opus ~1.5-2.5T/2-5T,還真和老馬手滑泄露的“Sonnet1T、Opus5T”對上了。



具體來看網友都討論出來了啥。

目前主流推測方法有四類:

  • 推理成本與吞吐量反推法:模型推理成本與激活參數量呈近似線性關系,而總參數量則可通過架構類型和行業經驗系數推算。
  • 性能基準對標法:通過與已知參數的開源模型在標準化基準上的表現對比,推斷閉源模型的參數規模。
  • 內部文件泄露與傳聞分析法:官方意外暴露的信息&一些小道消息。
  • 架構特性分析法:通過對模型行為特性的觀察,推斷其采用的架構類型,進而縮小參數估計范圍。

首先來看Claude 3系列,2024年3月發布,這是首個形成清晰產品矩陣的Claude系列,包含三個定位不同的版本。



小杯Haiku、中杯Sonnet以及大杯Opus,成本和性能依次遞增。



對于它們的參數規模,LifeArchitect.ai創始人Alan D. Thompson曾給出估算:

Claude 3 Haiku (~20B)、Claude 3 Sonnet (~70B)、Claude 3 Opus (~2T)。



對于Claude 3 Sonnet,Reddit社區后續也展開了持續討論,也有網友基于性能等推測Claude 3 Sonnet參數量在150-250B之間。



再來看Claude 3.5,這是Claude的一次重大升級,多個關鍵指標吊打GPT-4o。

不過,Anthropic最初只發布了獨苗Claude 3.5 Sonnet。



其速度是Claude 3 Opus的兩倍,成本卻僅為后者的1/5。



關于模型參數量,微軟等曾發布了一篇論文。



其中指出據行業估算,Claude 3.5 Sonnet參數約175B。

順帶附上其它模型估算參數:ChatGPT約175B、GPT-4約1.76T、GPT-4o約200B、o1-mini約100B、o1-preview約300B。



之后,Anthropic跳過了3.5命名,未發布3.5 Opus,在Claude Sonnet 3.7后直接進入4系列,發布了兩個模型:

Claude Opus 4和Claude Sonnet 4



圈內對于Claude 4的參數估計,存在較大分歧。

行業估算Claude Opus 4參數約在300–500B之間,Claude Sonnet 4約在50B-100B之間。

接下來Claude Opus 4.1發布。

其編程性能再次突破,超越Claude Opus 4,在Agent任務和推理方面也進一步升級。



不過發布時,官方表示計劃在未來幾周對模型進行更大規模升級與改進,看來4.1真就只是一次小更新,替代Opus 4。

甚至網友討論,Anthropic可能本來不想發模型,但是奈何GPT-5/Gemini-3的消息太多,為了保持市場競爭力所以先更新一波。

這可能也是關于其參數討論并不多的原因之一。

Hacker News有網友認為,其可能是Anthropic嘗試超大參數規模的實驗性產品,后續4.5版本反而縮小了參數規模以優化效率。

Anthropic對Opus 4/4.1進行了蒸餾,得到了Opus 4.5。這也是該模型的運行速度比Opus 4快約3倍,同時API調用成本僅為后者的三分之一的核心原因。
整個AI行業的發展方向,正在摒棄萬億參數規模的超大模型。當下的核心命題是提升現有參數規模的利用效率。
Opus 4.5參數量撐死也就在2T左右。Opus 4/4.1的參數量或許能達到約6T(MoE架構)。



再往下就是4.5系列了。

Claude Sonnet 4.5先發布,計算機操作方面,在OSWorld測試中取得了60.2分的SOTA成績,比Sonnet 4提升了近一半。

Claude Opus 4.5后腳跟上,前端開發、視覺能力顯著提升,更擅長使用電腦;在深度研究、PPT制作與電子表格處理等日常任務方面的表現也全面升級。



今年2月剛發布的最新4.6系列,各項能力再上一個臺階。

Anthropic表示,對填寫復雜Excel、網頁清單等計算機操作任務,Sonnet 4.6已經接近人類水平。



而Opus 4.6,在GDPval-AA(一項評估金融、法律和其他領域經濟價值知識工作任務的性能指標)上,比GPT-5.2高出144Elo;編程依舊獨領風騷,在Agent編程評估Terminal-Bench 2.0中取得了最高分,并在“人類最后考試”中領先所有其它前沿模型。

越往后,技術迭代步入深水區,底層技術和模型架構還一個勁地搞創新,想估算模型參數量,越來越難了。

最近,一篇發表在Substack的技術逆向工程分析,通過OpenRouter在Google Vertex和Amazon Bedrock上的Token吞吐數據,估算了Claude Opus 4.5和4.6的激活參數量。



作者署名unexcitedneurons,他以3個開源MoE模型為校準基準,推算出Vertex平臺的有效內存帶寬約為4.0–4.5TB/s,進而得出:

Opus 4.6在FP8精度下的激活參數量為93–105B。

若假設模型采用FP8精度稠密層+FP4精度混合專家層的配置,Opus 4.6的激活參數量約為127–154B。

結合不同專家稀疏度方案,最終他認為,Opus 4.5絕非網傳的10T+規模,它是一款體量小得多的模型,由Claude Opus 4/4.1蒸餾而來,參數量規模應落在1.5T-2T之間。

這一點也能從API定價中得到印證,Claude Opus 4.1的輸入/輸出定價為每百萬Token 15美元/75美元,而Claude Opus 4.5/4.6目前的定價僅為每百萬Token 5美元/25美元,價格直接降至原先的三分之一。

作者也提到,Claude Opus 4/4.1參數量大概率在5T-6T左右。

除了已發布模型的模型外,前幾天Anthropic團隊因權限配置失誤,把自家未發布模型泄露了。

模型Claude Mythos(內部代號Capybara)。

泄露文件中,曾多次使用質的飛躍這種說法來形容Mythos,在具體能力上,相較于Claude Opus 4.6,Mythos在軟件編碼、學術推理和網絡安全等測試中的得分顯著更高。

Claude Mythos,被稱為是迄今為止公司開發過的最強大的AI模型。



傳言稱模型參數達10T。

參考鏈接:
[1]https://x.com/lifetimization/status/2042285703162397167
[2]https://www.reddit.com/r/ClaudeAI/comments/1ixuxln/estimate_of_model_size_for_claude_37/
[3]https://lifearchitect.substack.com/p/the-memo-special-edition-claude-3
[4]https://arxiv.org/pdf/2412.19260v1
[5]https://medium.com/@bob.mashouf/claude-4-vs-llama-4-benchmarking-55b99c17d3f7
[6]https://news.ycombinator.com/item?id=47319205
[7]https://unexcitedneurons.substack.com/p/estimating-the-size-of-claude-opus

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗停火聲明發布,全文令人淚目,伊朗第一個要感謝的居然是中國

伊朗?;鹇暶靼l布,全文令人淚目,伊朗第一個要感謝的居然是中國

策前論
2026-04-08 18:42:20
老公自駕不帶妻子后續:婆婆強令同行,丈夫甩臉為難,目的藏不住

老公自駕不帶妻子后續:婆婆強令同行,丈夫甩臉為難,目的藏不住

阿纂看事
2026-04-08 16:48:41
不到24小時,美國真實想法暴露,伊朗準備戰斗到底,最大輸家出現

不到24小時,美國真實想法暴露,伊朗準備戰斗到底,最大輸家出現

混沌錄
2026-04-10 15:31:05
分道揚鑣?美媒:湖人或為引援放棄里夫斯,三大潛在下家出爐

分道揚鑣?美媒:湖人或為引援放棄里夫斯,三大潛在下家出爐

麥子的籃球故事
2026-04-10 15:47:43
形勢已然大變!西方媒體集體改口:中國,無需再向世界證明什么

形勢已然大變!西方媒體集體改口:中國,無需再向世界證明什么

通文知史
2026-04-09 12:40:09
人民幣匯率瘋了,還會繼續?

人民幣匯率瘋了,還會繼續?

拾榴詢財
2026-04-10 13:12:21
三位市長升任市委書記!三地黨委主要領導調整

三位市長升任市委書記!三地黨委主要領導調整

上觀新聞
2026-04-09 22:30:06
夏克立遭爆「狂傳對鏡自慰裸照」!2女被迫上床 前經紀人心痛發聲

夏克立遭爆「狂傳對鏡自慰裸照」!2女被迫上床 前經紀人心痛發聲

ETtoday星光云
2026-04-09 12:22:15
男演員最新聲明:已退出美國國籍,正式成為中國公民

男演員最新聲明:已退出美國國籍,正式成為中國公民

美芽
2026-04-08 18:02:54
哪個大聰明想出來的,用瓶蓋收納雞蛋!

哪個大聰明想出來的,用瓶蓋收納雞蛋!

新住家居
2026-04-09 07:06:35
全紅嬋報警:潛伏裁判給低分,郭晶晶看出貓膩,過往不公徹底曝光

全紅嬋報警:潛伏裁判給低分,郭晶晶看出貓膩,過往不公徹底曝光

眼光很亮
2026-04-08 14:51:46
全球又要大亂?俄中將陣亡,美油管被炸,四國集體失聲!

全球又要大亂?俄中將陣亡,美油管被炸,四國集體失聲!

星星沒有你亮
2026-04-09 11:32:47
霍爾木茲海峽的深水主航道在阿曼一側,波斯憑什么能主張收費

霍爾木茲海峽的深水主航道在阿曼一側,波斯憑什么能主張收費

歷史擺渡
2026-04-09 22:35:03
演員文章在上海開了一家陜西特色美食餐廳,熱情迎客態度謙和,女兒貼心幫忙宣傳

演員文章在上海開了一家陜西特色美食餐廳,熱情迎客態度謙和,女兒貼心幫忙宣傳

大象新聞
2026-04-09 23:41:02
蘋果給折疊屏起了個新名字,國產廠商連夜抄作業

蘋果給折疊屏起了個新名字,國產廠商連夜抄作業

薛定諤的BUG
2026-04-09 17:06:08
張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

魯中晨報
2026-04-07 17:13:05
“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

千言娛樂記
2026-04-09 09:17:50
美國“第一夫人”發表聲明

美國“第一夫人”發表聲明

魯中晨報
2026-04-10 09:24:04
鎮嵩軍的真實面目有多可怕?閹割男童,奸淫所有婦女,天良喪盡!

鎮嵩軍的真實面目有多可怕?閹割男童,奸淫所有婦女,天良喪盡!

混沌錄
2026-04-09 14:51:04
黃金、白銀,突然下跌

黃金、白銀,突然下跌

中國能源網
2026-04-10 11:26:15
2026-04-10 16:07:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12451文章數 176450關注度
往期回顧 全部

科技要聞

馬斯克狂發大火箭也養不起AI 年虧50億美元

頭條要聞

"小鎮唯一騎手"月入過萬:沒人跟他搶單 全鎮靠他吃飯

頭條要聞

"小鎮唯一騎手"月入過萬:沒人跟他搶單 全鎮靠他吃飯

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

夏克立婚內出軌 曾參加《爸爸去哪兒》

財經要聞

愛爾眼科一院長被指猥褻 總部:已被停職

汽車要聞

搭載第二代刀片電池及閃充技術 騰勢N8L閃充版預售35萬起

態度原創

藝術
教育
旅游
時尚
家居

藝術要聞

于小冬2026年4月油畫新作《花季》

教育要聞

二年級培優,難倒99%的學生

旅游要聞

第九屆龍雀獎揭曉!鄭州海昌海洋公園獲“年度主題公園品牌”

浪姐7亂成一鍋粥,誰都沒想到翻紅擔當竟然是她

家居要聞

復古風格 自然簡約

無障礙瀏覽 進入關懷版