337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

7800美元!微博Vibethinker-1.5B數學能力超越R1-671B

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!

當整個AI行業陷入“參數競賽”的狂熱時,微博AI交出了一份出乎意料的答卷,為沸騰的大模型戰場開辟了一條充滿想象力的新路徑。

近日,微博正式發布首個自研開源大模型VibeThinker,這個僅擁有15億參數的“輕量級選手”,在國際頂級數學競賽基準測試上擊敗了參數量是其數百倍的、高達6710億的DeepSeek R1模型。

更令人矚目的是,其單次“后訓練”的成本僅7800美元,對比DeepSeek-R1和MiniMax-M1等成本直接降低了幾十倍。

這一突破不僅重新定義了大模型的技術評價標準,更有望推動AI產業從“規模競賽”轉向“效率革命”。VibeThinker-1.5B已上線始智AI-wisemodel開源社區,歡迎大家前去體驗。

此模型是一個實驗性版本,旨在探索小型模型的推理能力,主要解決競賽風格的數學和算法編碼問題,用英語提問效果更好,不建議將其用于其他任務。


模型地址

https://wisemodel.cn/models/WeiboAI/VibeThinker-1.5B

01.

小模型打破參數崇拜

在AI發展史上,參數量曾被視為衡量模型能力的核心指標。

行業普遍認為,復雜推理能力需要1000億以上參數才能涌現,而小模型則因無法處理高難度問題被視為“天生不足”。

但如果從小模型入手,通過巧妙的訓練策略,能否挖掘出隱藏的推理能力?

微博自研開源大模型VibeThinker,給出了行業一個肯定的答案。

當大多數AI廠商仍遵循著“規模擴大即智能提升”的Scaling Law法則時,微博AI研發人員轉而優化模型結構和訓練范式,并創新提出了“頻譜到信號原理”(SSP)方法訓練,創造出了一個僅擁有15億參數的“輕量級選手”,但在AI競技場上戰勝了超越其數百倍體量的“巨人”。

VibeThinker一經發布,立即引起了全球AI研究界的廣泛關注,因其在一系列涵蓋數學、編碼的權威基準測試中,交出了一份出乎意料的答卷:


HuggingFace官方主動下場發文宣傳VibeThinker論文

在AIME24、AIME25以及HMMT25三個高難度數學測試集上的表現,VibeThinker超越了參數量超其400倍的模型DeepSeek-R1-0120版本(模型大小671B),與規模為456B的MiniMax-M1效果接近或相當,甚至媲美Gemini 2.5 flash和Claude Opus 4。

此外,在LiveCodeBench v6(編程算法題測試集)中的成績,VibeThinker成功追平參數量數超其數十倍的模型,比如歐洲領先AI企業Minstral.AI的深度思考模型Magistral-Medium-2506版本。

VibeThinker雄辯地證明,通過精巧的算法設計和訓練策略,一個小規模模型完全有潛力在復雜的邏輯推理任務上,達到甚至超越那些體量龐大數百倍的巨型模型,更為AI產業的成本結構、技術路線和資本布局帶來了全新的思考路徑。

需要說明的是,VibeThinker目前發布的版本尚處于實驗性版本,其研發重點主要集中于極大強化小模型復雜數學與競賽編程等方面的能力,其在日常聊天等能力還沒有做過針對性訓練優化,所以暫不適合作為日常聊天工具進行互動,更適用于數學和代碼等高智能應用場景。

02.

7800美元門檻重塑產業生態

訓練成本一直是制約AI技術普及的關鍵瓶頸,VibeThinker的成就不僅在于驚艷的性能,更在于其極致的成本效益。

根據公開數據,2025年主流大模型單次后訓練(Post-Training)成本普遍在數十萬美元級別。

上海AI企業MiniMax于今年6月發布的M1模型,使用512塊H800 GPU訓練三周,租賃成本約53.5萬美元,創始人發文表示:“第一次感覺到大山不是不能翻越。”

今年9月,AI初創公司DeepSeek(深度求索)的論文登上《自然》雜志。論文首次揭示了訓練R1的成本:僅為29.4萬美元。這不包括DeepSeek公司在開發R1所基于的基礎LLM(即DeepSeek-V3)上花費的約600萬美元,但總成本仍然遠低于競爭對手模型被認為花費的數千萬美元。

在這樣的行業背景下,VibeThinker整個后訓練過程(包括SFT和RL階段)總共只花費了約3900個GPU小時。按照當時的市場租賃價格,總計算成本僅7800美元


這也意味著,其用不到8000美元的成本,達到了需要花費30萬、甚至50萬美元才能企及的性能水平,成本效益比達到了驚人的30到60倍

這種成本上的顯著優勢,也意味著強大的AI推理能力不再是少數科技巨頭的專利,原本被巨頭壟斷的技術資源得以普惠,更多中小型公司、研究機構和大學,都有機會參與到前沿AI創新開發中來,極大地促進了AI研究的普惠化,推動整個行業朝著更開放、更多元、更具活力的方向發展。

03.

微博AI生態多點開花

技術突破的最終價值在于應用落地

微博積極擁抱人工智能發展趨勢,全面促進AI技術在多項業務場景的落地。

2024年,微博自主研發“知微”大語言模型,并成功通過備案,更陸續推出微博智搜、內容總結、AI互動號等前沿功能,優化用戶體驗,提升內容生產和互動效率。

基于自研的“知微”大模型,微博構建了適配微博場景的AI應用生態,并創造了兩大頂流AI產品:

  • 一是微博智搜,它通過深度分析平臺內海量優質內容,構建可信知識圖譜,實現“精準捕捉用戶需求、理解情感與場景”的突破性體驗,6月智搜月活躍用戶突破5000萬;

  • 二是評論羅伯特,作為AI互動賬號,它從毒舌風格起步,逐漸進化出溫情與聰明版本,成為廣大用戶“又愛又恨”的交流對象,全網粉絲近200萬,展現了AI評論助手的另一種可能性。

隨著自研大模型VibeThinker取得突破,更標志著微博AI戰略邁入新階段。

立足于自研大模型VibeThinker,微博的未來規劃凸顯了鮮明的“數據賦能”路徑。公司計劃深度融合其在心理等垂直領域積累的獨特數據資產,目標是打造一個更洞悉公眾情緒、更能服務社會化需求的專屬模型。

微博不僅是在優化一個大模型,更是在解鎖其數據生態的深層價值,以提供更精準、更懂用戶心理狀態的下一代社交服務。

VibeThinker的強大技術能力,或將成為驅動微博AI應用“多點開花”的核心引擎,深度融入平臺全業務生態。

未來,VibeThinker有望在微博智搜等核心AI產品中落地,不僅能持續提升用戶使用體驗,更有望打破場景邊界,裂變出兼具社交屬性與智能服務的下一個“社交超級生態”。

此外,VibeThinker的技術突破有望大幅降低微博AI應用成本。

無論是智能搜索的算力損耗,還是實時互動場景的AI響應成本,都將得到高效優化,讓平臺在規模化投入AI能力時無需承擔過高的資源壓力,進一步釋放微博的生態創新能力,為用戶帶來更豐富、更便捷的智能體驗。

04.

在線體驗/API

wisemodel社區-鏡像上線了“微博AI/VibeThinker-1.5B”的鏡像,支持一鍵創建在線體驗或者API服務,選中該鏡像,點擊部署在線體驗或者部署API服務。


進入后,根據需要填寫相應的信息,點擊“提交訂單”按鈕,體驗進入后臺的啟動階段。大概等待1分鐘左右,體驗進入運行中的狀態。


公開狀態的在線體驗可以在wisemodel社區-體驗與API”的頁面上點擊相應的體驗,進入體驗的頁面;私有狀態的在線體驗需要前往“用戶中心-我的資源-體驗”進入體驗的頁面。



----- END -----


wisemodel相關:

系列模型:

關于wisemodel更多

1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
杜月笙的識人術:只看對方的一個站姿,就能知道他是龍還是蟲

杜月笙的識人術:只看對方的一個站姿,就能知道他是龍還是蟲

千秋文化
2026-03-23 20:09:06
白鹿,張凌赫被傳復合?男方被曝只跟她談過,熱搜炸了:這倆兜兜轉轉,好體面....

白鹿,張凌赫被傳復合?男方被曝只跟她談過,熱搜炸了:這倆兜兜轉轉,好體面....

阿廢冷眼觀察所
2026-03-27 00:13:22
第81波打擊!以軍司令部遭襲擊,美迎來不眠之夜,特朗普求助35國

第81波打擊!以軍司令部遭襲擊,美迎來不眠之夜,特朗普求助35國

丁丁鯉史紀
2026-03-26 20:46:22
全球最大軍火商:外媒揭露美國軍工巨頭,全偷偷找中國“代工”

全球最大軍火商:外媒揭露美國軍工巨頭,全偷偷找中國“代工”

甜到你心坎
2026-03-24 21:18:22
四川省文物局局長唐飛:眉山文物資源呈現出三大特點丨關注四川歷史文化名城保護③

四川省文物局局長唐飛:眉山文物資源呈現出三大特點丨關注四川歷史文化名城保護③

北青網-北京青年報
2026-03-25 19:43:12
奇怪的現象:凡是家里打掃的很干凈的人,都有共同的特點

奇怪的現象:凡是家里打掃的很干凈的人,都有共同的特點

木言觀
2026-02-19 22:58:09
人有沒有心梗,散步就知道?得心梗的人,散步常有這2個表現

人有沒有心梗,散步就知道?得心梗的人,散步常有這2個表現

健康科普365
2025-12-18 10:01:25
汪小菲馬筱梅基因太絕!家中“小炸毛”萌翻全網這顏值太招人疼!

汪小菲馬筱梅基因太絕!家中“小炸毛”萌翻全網這顏值太招人疼!

孤酒老巷QA
2026-03-24 05:34:17
臺積電突然斷供?直接甩出“稀土”,外媒:這才是真正的殺手锏!

臺積電突然斷供?直接甩出“稀土”,外媒:這才是真正的殺手锏!

瑛派兒老黃
2026-03-24 18:56:06
歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
浙江省政府領導班子有調整

浙江省政府領導班子有調整

極目新聞
2026-03-26 09:59:46
頭皮發麻!紹興一住戶家中發現槍支

頭皮發麻!紹興一住戶家中發現槍支

紹興E網
2026-03-26 10:13:54
河南男子在縣城買下127平房子,4年后回來結婚,打開房門他愣住了

河南男子在縣城買下127平房子,4年后回來結婚,打開房門他愣住了

民間精選故事匯
2025-02-01 11:20:02
伊朗新最高領袖莫賈塔巴哈梅內伊已同意與美國進行談判并達成協議

伊朗新最高領袖莫賈塔巴哈梅內伊已同意與美國進行談判并達成協議

深度報
2026-03-25 22:47:08
加速冠心病惡化的行為:生氣僅排第5,排第1的,很多人每天都在做

加速冠心病惡化的行為:生氣僅排第5,排第1的,很多人每天都在做

健康科普365
2026-01-24 18:50:03
AI短劇沖擊橫店:有演員一個月只接到一部戲,有導演轉型做AI劇,“都在尋找出路”

AI短劇沖擊橫店:有演員一個月只接到一部戲,有導演轉型做AI劇,“都在尋找出路”

環球網資訊
2026-03-26 19:40:07
HBO把監獄女囚塞進5星酒店,觀眾追完4集后評分炸了

HBO把監獄女囚塞進5星酒店,觀眾追完4集后評分炸了

像素與芯片
2026-03-26 21:37:17
臺退役上校呼吁:只要大陸答應2個條件,臺灣隨時都可以和平統一

臺退役上校呼吁:只要大陸答應2個條件,臺灣隨時都可以和平統一

夢史
2026-03-27 01:05:45
中國摩托在越南被日本本田打的慘敗!現在又一路翻盤,太解氣!

中國摩托在越南被日本本田打的慘敗!現在又一路翻盤,太解氣!

萬物知識圈
2026-03-26 15:19:33
廣東91歲老人讓兒子保管900多萬養老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈與,全額返還

廣東91歲老人讓兒子保管900多萬養老錢,兒媳去世前卻將300多萬分給自己姐姐,老人瞬間傻眼,法院:錢是保管不是贈與,全額返還

觀威海
2026-03-18 22:11:07
2026-03-27 05:20:49
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

美團發布外賣大戰后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

親子
藝術
房產
教育
軍事航空

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務“健康關”如何保障?

藝術要聞

北京大興機場和青島膠東機場“撞臉”,長得像就是抄襲?

房產要聞

突發,三亞又有大批征遷補償方案出爐!

教育要聞

2026年高考可能“扎堆報考”的五大專業:就業缺口大,穩定且高薪

軍事要聞

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

無障礙瀏覽 進入關懷版