337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

上線兩天登頂全球榜單,階躍星辰怎么讓 AI 又「聰明」又「快」?

0
分享至


AGI的路怎么走?階躍星辰的答案是以巧見大,唯快不破

作者丨董子博

編輯丨林覺民


就在昨天,階躍星辰登頂了全球模型榜單——他們最新開源的Agent基座模型Step 3.5 Flash,發布首日便登上全球模型平臺OpenRouter最快模型榜,而發布后僅用短短兩天,就獲得了OpenRouter“熱度趨勢榜排名第一的好成績,其數據是基于全球開發者與用戶的實際模型調用量。也就是說,Step 3.5 Flash以硬實力贏得了用戶的“用腳投票”。


(圖為Step 3.5 Flash 登頂 OpenRouter 的Trending 榜單)

對階躍來說,拿下榜單第一并不新鮮,而這個成績有意思的地方在于,它點破了當前AI應用深化的一個普遍瓶頸:模型越來越聰明,能處理的任務越來越復雜,但用戶和開發者在真實使用時,最直接的感官體驗卻是——“

這里的“慢”,不是指回答一句“你好”的速度,而是當用戶任務變得復雜,任務鏈和工作流明顯變長(比如分析整篇財報、編寫復雜函數、或同時完成圖文音視頻多模態輸出等等)時,AI的處理速度必然下降,用戶的等待時間可能會被拖得很長。

漫長的等待——本身就嚴重限制了 AI 在實際工作流中的可用性;而如果等了半天,AI 拿出的結果還不能令人滿意,用戶的流失就已成定局。

而過去外界的一貫認知中,“快”=小參數模型的敏捷調用、輸出;“慢”=更大參數量級的模型和細致的思考。此前,模型要的是的平衡,而今天,階躍的Step 3.5 Flash卻敢于對世界說:我全都要!

01
MoE架構:

不要大而全,我要以巧見大

論速度,Step 3.5 Flash 有多快?

在復雜推理場景下,保證穩定性的同時Step 3.5 FlashNVDIA Hopper GPU的最高推理速度可以達到每秒350Token,實現點擊即輸出的秒速體驗。

榜單上,Step 3.5 Flash 以每秒 167 個 Token 的速度排名第九,但排在它前面的,多是在為專有硬件環境定制的模型和 8b-120b 規模不等的小型模型。


(圖為 Step 3.5 Flash 在 OpenRouter 的 Fastest 榜位居前列)

而 Step 3.5 Flash 的參數量是 1960 億,足以作為基座模型為 Agent 提供強勁的動力。


(Reddit平臺用戶評價:終于有東西能在我那只有120GB顯存的破電腦上運行了)

跑分測試上,Step 3.5 Flash 一馬當先,并且尤其擅長 Agent 場景和數學任務。在 τ2-Bench、BrowseComp 等測試,以及 LiveCodeBench V6 代碼挑戰和 AIME 2025 數學競賽中,Step 3.5 Flash 都拿出了不錯的成績。


圖注:Step 3.5 Flash 僅憑 11B 激活參數(總規模 196B MoE)便達到了頂尖級別的智能水平,足以媲美領先的閉源及開源模型(數據來源:階躍星辰官方Tech Report)

實踐上,Step 3.5 Flash 還在多步推理的結構化輸出、復雜邏輯求解、后端自動化和長時間運行任務中,已經具備了企業級應用落地的能力。而針對高頻工具調用和對行為可預測性有強要求的系統環境,Step 3.5 Flash 也能輕松駕馭。

“快”很容易,“強”也很容易。要理解 Step 3.5 Flash 為何能做到又快又強,首先要了解的,是它采用的“稀疏混合專家(MoE)架構”——這是一個在追求超大模型時代里,回歸工程理性的設計。

傳統的千億參數大模型像一個“全能巨人”,處理任何問題,無論難易,都要動用全部腦力(激活所有參數)。

每一次都“全力出擊”,這固然能保證能力,但計算成本極高的同時,也讓推理緩慢、能耗巨大,算力的浪費也同樣不可避免。

Step 3.5 Flash 的思路則不同。

作為一個總參數量1960億的Agent 原生基座模型,它被精巧地組織成了許多個“專家小組”。當一個問題輸入時,一個智能的路由機制會迅速判斷:“這個問題主要由哪幾個專家小組來處理最合適?”然后,只激活這些相關的“專家”——大約110億參數——來工作。


(海外用戶評價:它僅使用11b的活躍參數,所以運行速度極快。老實說,我對它毫無延遲的運行表現著迷。)

你可以把它想象成一個高度專業化的超級顧問團。接到一個金融分析任務,系統不會喚醒團里的醫學專家或文學教授,而是精準地調度金融、數據分析、邏輯推理這幾個小組來協同工作。

這種設計,既能讓每次推理實際消耗的計算資源大幅減少,提升了計算速度,成本也隨之下降;又能背靠“顧問團”1960 億參數的“總知識庫”,在需要處理復雜、跨界問題時,依然有能力調動不同領域的“專家”進行深度協作,讓輸出保質保量。

憑借著更聰明的調用,Step 3.5 Flash 采用的稀疏 MoE 架構,打破了“大模型”必須“力大磚飛”的固有印象,讓 AI 的能力和速度,成為了可以兼得的“魚與熊掌”。

02
不只是
跑得快,更是想得流暢

光是有了更高效的架構還不夠,Step 3.5 Flash 在具體工程實現上也做了不少優化,確保在真實場景中“跑”得流暢。

首先是處理長文本的“巧勁”。

人要學會快速瀏覽文本,就必須學會“一目十行”——AI 也一樣,面對一個超長文本還要快速輸出內容,就不能在生成新詞時,每次都全文逐字閱讀理解。這被稱為“全注意力”機制,雖然輸出效果更好,但 AI 的計算量會隨著文本長度呈平方級增長,是導致處理長文本時速度劇降、延遲飆升的主要原因。

要一目十行,模型就必須采取滑動窗口注意力(Sliding-Window Attention, SWA)的機制。

所謂滑動窗口,是基于一個符合直覺的觀察:在理解一個長句子或段落時,當前詞的含義最受其“鄰近”詞匯的影響,而距離很遠的詞影響相對較小。在這種機制下,模型能更專注于一個窗口中臨近詞匯的內容,讀的內容變少了,處理速度當然更快,成本也自然更低。

而 Step 3.5 Flash 則是博采眾長,采用了 3:1 的滑動窗口與全局注意力混合架構(SWA + Full Attention),對 256K 上下文有著高效的處理能力。

不光得快,Step 3.5 Flash得快。

傳統的模式,AI 生成 Token,要一個一個地“往外蹦”,在追求 AI 快交互的今天,這樣的速度明顯不夠。

而 Step 3.5 Flash 采用了多 Token 預測(Multi-Token Prediction, MTP-3) 的技術,一次可以完成多個 Token 的預測,這相當于讓 Token 的輸出從“單車道”變成了“多車道”,直接讓文本生成的吞吐效率翻了倍。

有了稀疏 MoE 架構,再整合了更先進的技術模式,給市場帶來的震撼是直接的:AI在處理復雜、多步任務時的“遲滯感”正在被抹平。無論是代碼生成、長文檔分析還是需要多輪思考的規劃任務,響應都變得更加即時和連貫。

Step 3.5 Flash 的出現,對于那些希望將 AI 深度集成到自動化工作流中的開發者而言,標志著一個實用的拐點——一個既聰明又敏捷的“AI大腦已經觸手可及。

03

結語

模型能力的升級,在今天似乎已經不是新鮮事——而 Step 3.5 Flash 的強勢登場,卻打破了過往的技術預設。

Step 3.5 Flash 所代表的,不僅僅是一個模型版本的迭代,更是一種技術路徑的明確:通往更強大的人工智能的道路,不一定只靠無限制地堆疊參數,通過架構創新和工程優化,在效能與能力之間取得精妙平衡,同樣是關鍵且務實的一步。

Step 3.5 Flash 登榜的勝利,不止是模型技術的勝利,更是模型工程的勝利,是階躍星辰在追尋 AGI 的路上,邁出的堅實一步。

今天,Step 3.5 Flash 已在 OpenRouter、GitHub、階躍 AI APP 和網頁端等多端同步上線,面向開發者提供免費試用與快速部署支持。而同時,階躍星辰也已啟動了下一代 Step 4 的研發,并邀請全球開發者“深度參與共創”,讓模型從工程中來,到工程中去,用最“落地”的方式做最“高級”的事情。

從 Step 3.5 Flash 開始,市場便能夠看到一條通往 AGI 更清晰的路徑——通過構建更快、更穩、更易獲取的智能基座,降低每一個創新者構建高級AI應用的門檻。

當無數開發者可以基于這樣的基座,在面對千行百業的具體問題時,都能創造出屬于自己的智能體,并且以更便宜、更便捷的方式滿足自己的實際需求,那時的我們距離AGI,或許可以又近了一點點。

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
江蘇省委組織部最新公告

江蘇省委組織部最新公告

飛鶴傳媒
2026-03-21 20:35:17
胡塞領導人:我們參戰只打侵略者,中國不跟美以合污我們絕不為難

胡塞領導人:我們參戰只打侵略者,中國不跟美以合污我們絕不為難

傾世璃歌
2026-03-22 06:38:35
章子怡這一整像好多人 就是越來越不像自己 網友:變萌變好看了

章子怡這一整像好多人 就是越來越不像自己 網友:變萌變好看了

塵埃里的看客
2026-03-20 22:32:14
拜仁4-0柏林聯合 格納布里雙響

拜仁4-0柏林聯合 格納布里雙響

上游新聞
2026-03-22 08:48:10
一男子撿到金鐲子賣了三十萬,幾天后,發現竟藏在妻子的枕頭下

一男子撿到金鐲子賣了三十萬,幾天后,發現竟藏在妻子的枕頭下

情感大師級
2026-03-13 11:35:11
我今年55了,想用血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這三件事

我今年55了,想用血淚教訓告訴你:不要跟任何人,包括你的父母、子女、枕邊人,分享這三件事

東林夕亭
2026-03-19 09:04:30
扎心!官方發布:醫學碩士就業率跌破40%

扎心!官方發布:醫學碩士就業率跌破40%

醫脈圈
2026-03-20 12:09:22
荷蘭斷供后德國變臉,晶圓政策180度轉向

荷蘭斷供后德國變臉,晶圓政策180度轉向

快樂彼岸
2026-03-22 03:28:09
張展碩擊敗大滿貫巨星馬騰斯,美國媒體:他是400自世界第一選手

張展碩擊敗大滿貫巨星馬騰斯,美國媒體:他是400自世界第一選手

楊華評論
2026-03-21 22:18:41
馬卡:歐冠后姆巴佩狀態一直在改善,內部認為他已恢復到100%

馬卡:歐冠后姆巴佩狀態一直在改善,內部認為他已恢復到100%

懂球帝
2026-03-22 08:55:00
干翻偉哥?國產ED新藥藥效翻5倍,百億市場變天還是割韭菜?

干翻偉哥?國產ED新藥藥效翻5倍,百億市場變天還是割韭菜?

風風順
2026-03-22 07:03:37
51歲男子突發心梗猝死!不想得心梗,牢記晚飯4不吃,睡前4不要!

51歲男子突發心梗猝死!不想得心梗,牢記晚飯4不吃,睡前4不要!

健康之光
2026-03-20 17:05:06
帶著饑餓感入睡能減肥?醫生提醒:長期餓著睡,這些疾病會找上你

帶著饑餓感入睡能減肥?醫生提醒:長期餓著睡,這些疾病會找上你

心靈的觸動a
2026-03-20 15:55:25
勇士熬出頭!知情人曝庫里傷情:最快25日復出打籃網

勇士熬出頭!知情人曝庫里傷情:最快25日復出打籃網

仰臥撐FTUer
2026-03-22 08:31:04
正式退役!整整28年啊,終于可以退役了,神射手終于圓夢了

正式退役!整整28年啊,終于可以退役了,神射手終于圓夢了

球童無忌
2026-03-21 00:47:48
孫玉同志逝世

孫玉同志逝世

新京報政事兒
2026-03-21 21:41:03
雷克薩斯全新一代ES300h正式開啟預售,30.88萬元起

雷克薩斯全新一代ES300h正式開啟預售,30.88萬元起

凡兮說
2026-03-20 15:53:49
OPPO Find N6首銷打破近一年行業記錄 起售價格9999元

OPPO Find N6首銷打破近一年行業記錄 起售價格9999元

CNMO科技
2026-03-21 12:07:21
2026年犯兇星5個屬相 2026年犯兇星的屬相有幾個

2026年犯兇星5個屬相 2026年犯兇星的屬相有幾個

食物心理營養師
2026-03-22 07:15:29
心理學家忠告:想讓孩子心理陽光,請立刻戒掉這5種‘有毒人格’

心理學家忠告:想讓孩子心理陽光,請立刻戒掉這5種‘有毒人格’

戶外阿毽
2026-03-18 17:32:32
2026-03-22 09:11:00
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7134文章數 20742關注度
往期回顧 全部

科技要聞

庫克在華這四天,一場既定的市場秀

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區回應

頭條要聞

男子在壺口瀑布外拍視頻喊"門口要錢"被投訴 景區回應

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

旅游
本地
家居
手機
公開課

旅游要聞

千畝杏林迎客來,濟南南山柳埠街道解鎖春日度假新玩法

本地新聞

春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

家居要聞

時空交織 空間綺夢

手機要聞

內存大漲價倒逼手機SD卡復活 網友:今夕是何年

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版