337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

擴(kuò)散模型成最快深度思考!告別自回歸每秒1009個tokens

0
分享至

首個會深度思考的擴(kuò)散模型來了!

拋棄自回歸范式,一舉成為世界上生成速度最快的模型。

你瞅瞅,對比之下傳統(tǒng)自回歸的“打字機模式”(按順序一個個token往外吐)是不是就有點像烏龜了:



實際測評顯示,這款名為Mercury 2的擴(kuò)散推理LLM在英偉達(dá)GPU上可實現(xiàn)1009個tokens/s

這個速度整整比GPT-5(mini)和Claude-4.5(haiku)這些傳統(tǒng)模型快了5倍。



消息一出,英偉達(dá)第一時間跑來祝賀了(當(dāng)然也可能是因為它投了Mercury 2背后的公司):



一眾網(wǎng)友也紛紛坐不住,畢竟最近很火的“龍蝦們”也少不了對速度的極限追求:



還有人已經(jīng)開始懷念自回歸曾經(jīng)的風(fēng)光了(doge)。



so,Mercury 2是誰?它又是如何突破速度瓶頸的呢?

不止是快,還穩(wěn)

原理其實很簡單。

前面已經(jīng)說了,傳統(tǒng)自回歸就像打字機一樣,一次只能處理一個token,且必須按照從左到右的順序。

但擴(kuò)散模型Mercury 2的工作方式更像一位編輯——

你不是在看它打字,而是看它拿到一份草稿后,立刻拿著紅筆在整頁紙上同時圈改。

換言之,一次生成答案草稿再整體編輯。

這種“并行優(yōu)化”機制,使得Mercury 2不需要等待前一個字的結(jié)果就能生成下一個字,因此響應(yīng)速度極快,延遲不再與輸出長度成正比。

最終,Mercury 2能將生成速度提升5倍以上,且速度曲線截然不同

瞅瞅,在第三方測評中,其輸出速度可謂一騎絕塵。



和市面主流的頂尖模型比,速度也是獨一檔的存在。



而且不止是快,它在性能、價格方面都具有一定優(yōu)勢。

延遲低至1.7s的情況下,在GPQA(科學(xué)問答)、LCB(編程)、AIME(數(shù)學(xué))等多個基準(zhǔn)測試中,Mercury 2的得分普遍高于或持平于那些速度較慢的“小型/輕量級”模型(如GPT-5 Nano, Claude 4.5 Haiku)。

甚至在AIME上的得分超過了公認(rèn)的“性能怪獸”Gemini 3 Flash(推理版) 。

這說明Mercury 2在保持極高速度的同時,并不以犧牲智商為代價。



它目前支持128K上下文,輸入價格為每百萬token 0.25美元(約合人民幣1.7元),輸出價格為每百萬token 0.75美元(約合人民幣5.2元)。

綜合速度與價格,Mercury 2也保持了較高性價比。



官方表示,Mercury 2的這種速度優(yōu)勢改變了推理。

  • 如今,更高的智能意味著更多的test-time計算——更長的鏈、更多的樣本、更多的重試,而這直接以延遲和成本為代價。基于擴(kuò)散的推理能夠在實時延遲預(yù)算內(nèi)實現(xiàn)推理級別的質(zhì)量。

背后公司一開始就押注擴(kuò)散模型

最后介紹一下Mercury 2背后的公司及團(tuán)隊。

它是由Inception Labs這家成立于2024年的硅谷初創(chuàng)公司推出的。

從一開始這家公司就力押擴(kuò)散模型,其核心使命為——

用全新的、基于擴(kuò)散/diffusion的生成機制替代傳統(tǒng)的自回歸Transformer模型,從根本上突破速度與成本瓶頸。

他們認(rèn)為,傳統(tǒng)自回歸模型的缺陷不言自明——延遲和成本會隨著token數(shù)量的增加而增加。

而擴(kuò)散模型采用由粗到精的生成過程。它并非逐個提交數(shù)據(jù),而是通過少量步驟并行迭代地細(xì)化輸出。這使得在生成過程中可以進(jìn)行修改,并帶來截然不同的速度-成本曲線。一言以蔽之:

  • 人工智能不應(yīng)該像單向打字機那樣運作,而應(yīng)該更像一個編輯。

基于此,他們開始在Mercury系列中踐行這一理念。

2025年2月,發(fā)布全球首個基于擴(kuò)散模型的商業(yè)級語言模型——初代Mercury,一開始就把生成速度拉到傳統(tǒng)的5倍以上,而且同一時間還推出編程助手Mercury Coder。

一年之后,升級版Mercury 2問世,在推理和多智能體日益進(jìn)入主流視線的今天,帶來了更多可能。



事實上,早在2019年,這家公司的聯(lián)創(chuàng)兼CEO Stefano Ermon就開始投身擴(kuò)散模型的研究了。

時任斯坦福大學(xué)計算機科學(xué)教授的Stefano Ermon,很早就思忖著將擴(kuò)散模型應(yīng)用于內(nèi)容生成。

當(dāng)時主流的圖像生成模型還在使用GAN(生成對抗網(wǎng)絡(luò)),但他和團(tuán)隊認(rèn)為結(jié)果“不夠好”,于是開始嘗試應(yīng)用Diffusion。

而在看到Diffusion的效果不錯后(后來Midjourney、DALL-E等都是用這種方法),他們開始將研究目光轉(zhuǎn)向文本和代碼生成。

  • 圖像由連續(xù)的像素構(gòu)成,而文本由離散的token構(gòu)成。之前成功的擴(kuò)散模型理論(如去噪得分匹配)是建立在連續(xù)空間上的,無法直接遷移到文本。

于是在2023年,他和團(tuán)隊發(fā)表了一篇關(guān)鍵性論文《Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution》,里面介紹了一種名為Score Entropy Discrete Diffusion models(SEDD)的模型。

該模型創(chuàng)新性提出了“分?jǐn)?shù)熵”(score entropy)這一全新?lián)p失函數(shù),它巧妙地將連續(xù)空間的分?jǐn)?shù)匹配理論擴(kuò)展到了離散數(shù)據(jù)領(lǐng)域。

這使得擴(kuò)散模型能夠像理解圖像一樣,去理解和生成語言。



論文結(jié)果表明,SEDD的表現(xiàn)明顯優(yōu)于當(dāng)時已有的語言模型,困惑度比未退火(未使用“動態(tài)調(diào)整溫度”這個優(yōu)化技巧)的GPT-2好6-8倍。

(注:后來這篇論文還獲得了ICML 2024最佳論文獎)

見此,Stefano Ermon決定通過創(chuàng)業(yè)將技術(shù)價值放大。

于是在2024年夏天,他邀請美國加利福尼亞大學(xué)洛杉磯分校教授Aditya Grover(左)和美國康奈爾大學(xué)教授Volodymyr Kuleshov(右)加入Inception Labs。



去年11月,這家公司還宣布獲得了5000萬美元融資,而且投資陣容相當(dāng)豪華。

除了NVentures(英偉達(dá)風(fēng)投部門)、M12(微軟旗下風(fēng)險基金)、Menlo Ventures (領(lǐng)投方、知名長期風(fēng)投機構(gòu))等明星機構(gòu),還不乏吳恩達(dá)、卡帕西這些AI大佬。

可以說,堅持走擴(kuò)散模型路子的Inception Labs始終穩(wěn)扎穩(wěn)打并獲得市場支持。

最后順便一提,Mercury 2目前暫無開源計劃,不過其API全面兼容OpenAI標(biāo)準(zhǔn)。

感興趣的朋友也可親自上手一試了。

體驗地址:
https://chat.inceptionlabs.ai/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
寫給所有被網(wǎng)貸壓垮的人:2026年,是你翻身最容易的一年

寫給所有被網(wǎng)貸壓垮的人:2026年,是你翻身最容易的一年

我不叫阿哏
2026-03-06 20:12:30
曝詹姆斯下賽季無意效力勇士!今夏選擇只有三個:湖人騎士或退役

曝詹姆斯下賽季無意效力勇士!今夏選擇只有三個:湖人騎士或退役

羅說NBA
2026-03-10 08:05:46
財政部、人社部發(fā)布消息,今年養(yǎng)老金或再漲,低于3200元多漲嗎?

財政部、人社部發(fā)布消息,今年養(yǎng)老金或再漲,低于3200元多漲嗎?

有范又有料
2026-03-09 11:43:18
伊朗開霍爾木茲海峽通行條件

伊朗開霍爾木茲海峽通行條件

閃電新聞
2026-03-10 15:49:06
毫不避諱,
王毅外長正式回應(yīng)特朗普訪華!

毫不避諱, 王毅外長正式回應(yīng)特朗普訪華!

南權(quán)先生
2026-03-10 15:26:57
你最爽的經(jīng)歷是什么?網(wǎng)友:約過一個比我大好幾歲的姐姐

你最爽的經(jīng)歷是什么?網(wǎng)友:約過一個比我大好幾歲的姐姐

帶你感受人間冷暖
2026-02-16 01:10:39
054A抵達(dá)伊朗海域護(hù)航

054A抵達(dá)伊朗海域護(hù)航

烽火觀天下
2026-03-10 11:54:38
請注意:10日美以將進(jìn)入伊朗空域全面轟炸,福特號已前往波斯灣

請注意:10日美以將進(jìn)入伊朗空域全面轟炸,福特號已前往波斯灣

邵旭峰域
2026-03-07 17:50:03
見過日本人的駕照,才知道什么是牛鬼蛇神

見過日本人的駕照,才知道什么是牛鬼蛇神

不相及研究所
2026-03-07 22:04:00
坑慘國人的四個“偽豪車”,國外當(dāng)草國人當(dāng)寶,二手車販避之不及

坑慘國人的四個“偽豪車”,國外當(dāng)草國人當(dāng)寶,二手車販避之不及

番外行
2026-03-10 08:08:05
就在19點!亞洲杯1/4決賽對陣出爐,中國女足爭冠2大有利條件曝光

就在19點!亞洲杯1/4決賽對陣出爐,中國女足爭冠2大有利條件曝光

侃球熊弟
2026-03-10 09:35:56
楊瀚森:來NBA打球不是很焦慮;跟約基奇打10分他10我0

楊瀚森:來NBA打球不是很焦慮;跟約基奇打10分他10我0

懂球帝
2026-03-10 12:23:38
網(wǎng)貸公司,遺老遺少大清洗

網(wǎng)貸公司,遺老遺少大清洗

巨潮WAVE
2026-03-10 13:59:52
越扒瓜越大!魯山舅舅與亡姐結(jié)婚再添猛料,遠(yuǎn)不止吃絕戶這么簡單

越扒瓜越大!魯山舅舅與亡姐結(jié)婚再添猛料,遠(yuǎn)不止吃絕戶這么簡單

夢史
2026-03-07 09:26:14
時間節(jié)點如何?轟炸1月,全面轟炸即將開始、大體1周,月底有眉目

時間節(jié)點如何?轟炸1月,全面轟炸即將開始、大體1周,月底有眉目

邵旭峰域
2026-03-09 12:52:01
新疆首府為何設(shè)在烏魯木齊,而不是條件更好的庫爾勒、喀什或伊犁

新疆首府為何設(shè)在烏魯木齊,而不是條件更好的庫爾勒、喀什或伊犁

銘記歷史呀
2026-03-09 14:18:43
Windows 11系統(tǒng)OpenClaw(龍蝦)安裝教程|保姆級一步到位

Windows 11系統(tǒng)OpenClaw(龍蝦)安裝教程|保姆級一步到位

星哥說事
2026-03-08 23:47:27
廣東男籃崔永熙復(fù)出時間確定,郭昊文遭桃色雷錘,山東新援將到位

廣東男籃崔永熙復(fù)出時間確定,郭昊文遭桃色雷錘,山東新援將到位

中國籃壇快訊
2026-03-10 15:46:55
退休人員好消息,政府工作報告敲定養(yǎng)老金調(diào)整,調(diào)整比例達(dá)13.98%

退休人員好消息,政府工作報告敲定養(yǎng)老金調(diào)整,調(diào)整比例達(dá)13.98%

社保小達(dá)人
2026-03-10 11:10:05
印度在伊朗背后捅了一刀!戰(zhàn)略機遇把握不住:伊朗那就有打不完的仗

印度在伊朗背后捅了一刀!戰(zhàn)略機遇把握不住:伊朗那就有打不完的仗

星辰大海路上的種花家
2026-03-09 13:19:55
2026-03-10 16:59:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12260文章數(shù) 176413關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

特朗普稱已考慮接替穆杰塔巴的人選 外交部表態(tài)

頭條要聞

特朗普稱已考慮接替穆杰塔巴的人選 外交部表態(tài)

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

財經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮現(xiàn)

汽車要聞

蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

態(tài)度原創(chuàng)

手機
本地
時尚
親子
公開課

手機要聞

vivo X300s新機官宣“移植”藍(lán)廠最強性能電競體驗全家桶

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

沒有人不愛這個穿平底鞋都發(fā)光的女人

親子要聞

兩會專訪|近視低齡化如何破解?林順潮代表:協(xié)同發(fā)力減少兒童使用電子產(chǎn)品時長

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版