網易首頁 > 網易號 > 正文申請入駐

豆包 2.0 模型發布，全信息整理（全網最完整，另附 79 頁 Model Card）

2026-02-14 15:11:50　來源: 賽博禪心

北京舉報

分享至

今天 Seed2.0 全系列正式發布
Seed2.0，也就是豆包大模型2.0（Doubao-Seed-2.0）

包括 Pro、Lite、Mini 三款通用 Agent 模型加一個 Code 模型，圍繞 Agent 使用和大規模生產，做了系統性優化

先看數據（本文里所有表格，都是我做的，好不好看！！！）

Seed2.0 核心評測數據總覽｜vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次過完核心部份：

多模態，數學與視覺推理 19 項基準 12 項第一，視覺感知、文檔理解、長上下文大部分基準 SOTA，EgoTempo 超過人類分數

LLM 科學能力，HealthBench 第一，SuperGPQA 超 GPT-5.2，整體與 Gemini 3 Pro、GPT-5.2 相當；在深度研究上也取得了不俗的成績

代碼，有明顯進步，部分高難基準與國際領先模型仍有差距

已上線，豆包 App 選「專家」模式 / TRAE 選「Doubao-Seed-2.0-Code」，全系列 API 已上線火山引擎，價格較同級 GPT 和 Claude 便宜一個數量級

Model Card 也有，同時發布的還有一份 79 頁的 Model Card，公眾號后臺回復「Seed2.0」，獲取這份 Model Card

先說定價

Seed2.0 全系列的這四款模型，API 已上線火山引擎。以下為分段計費中 ≤32k 輸入的價格，單位元/百萬 tokens，這里我也做了個對比圖：

價格對比（人民幣計價）

Pro（doubao-seed-2-0-pro-260215）旗艦全能，面向復雜推理與長鏈路 Agent 任務
輸入 3.2 / 輸出 16 / 緩存命中 0.64

Lite（doubao-seed-2-0-lite-260215）均衡型，綜合能力超 Seed1.8，兼顧質量與速度
輸入 0.6 / 輸出 3.6 / 緩存命中 0.12

Mini（doubao-seed-2-0-mini-260215）低時延高并發，256k 上下文，4 檔思考長度
輸入 0.2 / 輸出 2 / 緩存命中 0.04

Code（doubao-seed-2-0-code-preview-260215）編程加強版，適配 Claude Code 等 IDE 工具鏈
輸入 3.2 / 輸出 16 / 緩存命中 0.64

四款模型均支持文字、圖片、視頻輸入，文字輸出

token 定價，比海外模型低了約一個數量級。Agent 跑一次 workflow 消耗的 token 是人類對話的幾十倍

在現實世界的復雜任務中，大規模推理與長鏈路生成將消耗大量 token，這個成本變量會越來越重

火山引擎模型詳情頁：https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的優化

Seed 團隊分析了通用模型在 MaaS 服務中的真實調用情況

MaaS 調用場景分布

Seed 通用模型 MaaS 服務在中國大陸的調用場景分布，數據來自「火山方舟協作獎勵計劃」

最高比例的需求是處理混雜圖表、文檔等非結構化信息的知識內容。企業端的典型模式：先讓模型做「讀得多、想得多」的任務，再進入復雜且專業的流程型工作

基于這個真實需求，Seed2.0 重點優化三個方向：

?更穩健的視覺與多模態理解：復雜文檔、表格、圖形、視頻內容的解析能力顯著提升
?更可靠的復雜指令執行：多約束、多步驟、長鏈路任務的理解與執行能力強化
?更靈活的推理選擇：Pro、Lite、Mini 三檔加 Code 模型，覆蓋不同場景

除了生產級需求，Seed2.0 還在推高模型智能上限。目前已經能從解決奧林匹克競賽類問題邁向支持研究級推理，比如嘗試探索埃爾德什級別的數學問題，也可以完成部分科學相關任務的編程工作

能解埃爾德什問題和能幫你整理一堆掃描版合同，是兩種能力
Seed2.0 兩個都在做

多模態理解：大部分基準 SOTA 數學與視覺推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數學推理基準上達到業界最優水平。LogicVista、VisuLogic 等視覺解謎與邏輯推理基準上，較 Seed1.8 顯著提升

數學與視覺推理評測數據

標注 * 的數據引自公開技術報告

視覺感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基準中取得業界最高分。面對不同類型的視覺輸入時仍能保持準確且可信的感知和判斷能力

視覺感知與通用 VQA 評測數據

標注 * 的數據引自公開技術報告

文檔理解與長上下文

模型面對的，往往是復雜版式混排的原始材料。相比 Seed1.8，處理非結構化信息的能力顯著強化，ChartQAPro 與 OmniDocBench 1.5 達到頂尖水準

長上下文方面，DUDE、MMLongBench、MMLongBench-Doc 均取得業界最佳分數

文檔理解與長上下文評測數據

標注 * 的數據引自公開技術報告

視頻理解

時間序列與運動感知方面，TVBench、TempCompass、MotionBench 等關鍵測評處于領先位置

EgoTempo 超過人類分數（人類 63.2，Seed2.0 Pro 71.8），對「變化、動作、節奏」的捕捉更為穩定

長視頻場景中，Seed2.0 在大部分評測上超越了其他頂尖模型，可以高效準確地處理小時級別的長視頻。視頻工具 VideoCut 進一步提高了長視頻處理的時長范圍和推理精度

流式實時視頻方面同樣表現優異，能完成實時視頻流分析、環境感知、主動糾錯與情感陪伴，可應用于健身、穿搭等場景

視頻理解評測數據

標注 * 的數據引自公開技術報告

LLM 與 Agent：真實長程任務執行能力提升

Seed 團隊觀察到一個典型失衡：模型已經可以順利解決競賽難題，但放在真實世界中，依然很難端到端地完成實際任務，比如一次性構建一個設計精良、功能完整的小程序

原因來自兩點。真實世界任務跨越更長時間尺度、包含多個階段，現有 LLM Agent 難以自主構建高效工作流。真實世界知識具有很強的領域壁壘且呈長尾分布，各行業的經驗不在訓練語料的高頻區

長尾領域知識

Seed2.0 通過系統性加強長尾領域知識來應對

SuperGPQA 超過 GPT-5.2，HealthBench 第一名，科學領域整體成績與 Gemini 3 Pro 和 GPT-5.2 相當。FrontierSci 等 STEM 基準表現突出，部分場景得分超過 Gemini 3 Pro

LLM 科學能力評測數據指令遵循

Seed2.0 保持較強的一致性與可控性，為 Agent 模型在長鏈路、多步驟任務中嚴格按約束條件執行奠定了基礎

指令遵循評測數據深度研究

Seed2.0 在長鏈路任務中表現突出，尤其擅長連續完成「找資料、做歸納、寫結論」這類連續工作流

三項深度研究評測，Pro 和 Lite 都取得了不俗的成績

深度研究評測數據真實世界任務

在具備直接經濟價值的現實任務評測中，Seed2.0 在客服問答、信息抽取、意圖識別、中小學階段問題解答等高頻場景上表現穩定。GDPVal-Diamond、XPert Bench 等復雜專業任務基準上同樣取得有競爭力的結果

真實世界任務評測數據科學發現

FrontierSci-research 等前沿科研基準上表現強勁，AInstein Bench 領先，體現出在科學發現場景中較強的假設驅動式推理能力

科學發現評測數據從研究想法到實驗方案

Seed2.0 還能把「研究想法」推進到「形成可落地的實驗方案」

以高爾基體蛋白分析為例，模型把基因工程、小鼠模型構建、亞細胞分離與多組學分析串成一條完整流程，細化到關鍵環節怎么做、用什么做對照排除污染、用哪些指標評估純度

相關領域專家的反饋：方案在跨學科的實驗細節與步驟化表達上超出預期，能產出結構清晰、科學上相對可靠、具有可執行性的實驗草案

高爾基體蛋白分析實驗方案示例代碼：有進步，有差距

端到端整體代碼生成、上下文學習方面取得了明顯進步

Vibe Coding 及上下文評測數據

部分高難基準上，與國際領先模型相比仍有提升空間

最后

除了火山 API 之外，Seed2.0 Pro 和 Code 還已分別上線：

? 豆包 App：選擇「專家」模式，開啟對話
? TRAE：在「內置模型」中選擇「Doubao-Seed-2.0-Code」

以及，火山的這個模型，也已上線方舟 Coding Plan，且首月低至 8.91 元

新春限時特惠 ?? 二月特別補貼

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Cursor自研模型反超Opus 4.6！價格腳踝斬，氛圍編程沸騰了

量子位 2026-03-20 12:07:45
8 跟貼 8
阿里、Kimi、螞蟻集體押注，混合注意力從可選項變必答題？

智東西 2026-03-20 19:27:31
0 跟貼 0

搞不懂Skills？看看Claude Code內部工程師們是怎么玩的

機器之心Pro 2026-03-20 14:21:04
3 跟貼 3

微軟提出Computer-Using World Model，教智能體理解動作的后果

機器之心Pro 2026-03-09 11:59:44
0 跟貼 0
AWE2026專題總結欄目上線！悟空10分鐘生成，歡迎訪問

雷科技 2026-03-20 11:54:56
0 跟貼 0

#豆包出大片有兩把刷子

鸚鵡梨 2026-03-18 03:53:25
0 跟貼 0

AI能否「圣地巡禮」？多模態大模型全新評估基準VIR-Bench來了

機器之心Pro 2025-10-15 16:05:02
0 跟貼 0
太瘋了！MIT博士在Transformer里造計算機，攻破LLM終極缺陷

新智元 2026-03-21 10:11:31
7 跟貼 7

MoGraphGPT：基于模塊化大模型與圖形控制的2D交互場景創作

機器之心Pro 2026-03-20 17:17:16
0 跟貼 0
“媽，門口要錢，我們就不進去看你了”，游客在壺口瀑布外拍視頻被投訴侵權，山西壺口瀑布景區：事發地是陜西壺口瀑布，我們也是受害者

觀威海 2026-03-18 14:47:02
41641 跟貼 41641
從能力到商品：Skills市場正在重塑開發者的生產方式

36氪 2026-03-20 10:24:05
17 跟貼 17
模型飛機試飛，鏡頭一轉發現事不簡單，美女吃了熊心豹子膽

美妙一籮筐 2026-03-20 11:43:33
0 跟貼 0
去冥王星9年，去天狼星要16萬年，在宇宙尺度前，人類多渺小？

開心奇異果 2026-03-20 14:13:22
4 跟貼 4
江蘇省省管領導干部任職前公示

江蘇新聞 2026-03-20 18:08:11
131 跟貼 131
被OpenClaw“選中”的飛書，推出了自己的官方版“龍蝦”

每日經濟新聞 2026-03-19 16:22:15
0 跟貼 0
預算25萬，理想L6和Model Y怎么選，來聽聽車主的真實感受！

巴比倫生活 2026-03-18 09:01:37
0 跟貼 0
理想汽車2026 GTC發布MindVLA-o1模型，讓車具備理解3D空間能力

IT之家 2026-03-18 22:54:07
1 跟貼 1
AI編程元年：初級開發者被「團滅」？

新智元 2026-03-21 12:38:36
1 跟貼 1
AI取代程序員還遠！新基準BeyondSWE：頂尖模型通過率暴跌至45%

新智元 2026-03-20 21:23:15
1 跟貼 1
Cursor套殼Kimi敗露，最強「自研」模型被錘！創始人：忘記署名了

量子位 2026-03-21 13:25:02
1 跟貼 1
別自己寫簡歷了！豆包+智譜清言3分鐘生成的簡歷，讓我收到了5份Offer！

秋葉PPT 2026-03-21 08:22:10
3 跟貼 3
1美元Token撬動4800美元收益!百萬美元級基準,最賺錢Agent出現了

機器之心Pro 2026-03-10 10:06:03
0 跟貼 0
特斯拉：通過感知、學習去理解并適應世界！

新浪財經 2026-03-21 02:52:37
0 跟貼 0
上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

新民晚報 2026-03-20 19:27:19
989 跟貼 989
看齊公募基金，銀行理財業績基準或告別固定區間，向指數化轉型

財聯社 2026-03-20 20:30:10
0 跟貼 0
小伙挖植物前豆包告訴他可以挖，結果到家后豆包“改口”聽說是國家二級保護小伙瞬間石化

柚子Video 2026-03-19 08:07:46
1 跟貼 1
留給豆包手機的盟友不多了

華爾街見聞官方 2026-03-20 21:35:34
0 跟貼 0
什么豆包，我在外面叫喪彪

貓少影視推薦 2026-03-19 09:42:22
1 跟貼 1
媽媽春日和豆包聊天，聊著聊著把自己感動哭了

科教聚焦 2026-03-19 18:09:14
0 跟貼 0
成品油價即將迎來“五連漲”，下周一加滿一箱油可能將多花80元，周末記得加滿油

揚子晚報 2026-03-21 07:37:10
18045 跟貼 18045
真人版豆包出現，小姐姐顏值相似度拉滿，藝術來源于生活！

會玩的小娃娃 2026-03-21 12:49:53
1 跟貼 1
1101套房只有1人選房，深圳一安居房項目屢戰屢“冷”

南方都市報 2026-03-20 22:14:18
775 跟貼 775
再見，“四字外援”！丁彥雨航退役，曾在山東男籃效力9個賽季

齊魯壹點 2026-03-21 07:12:12
68 跟貼 68
匈牙利和斯洛伐克堅決反對，峰會氣氛冷淡尷尬，歐盟未通過900億歐元援烏貸款

環球網資訊 2026-03-21 07:07:24
75 跟貼 75
上海百年老店官宣閉店！曾經去吃頓飯可要一大早就排長隊，承載了幾代人的記憶，不少阿姨爺叔的“第一次”

上觀新聞 2026-03-18 17:41:49
919 跟貼 919
想玩機械模型？這個能發動！#金屬拼裝 #V12發動機

制造科技 2026-03-19 23:00:29
0 跟貼 0
加拿大10年期基準國債收益率漲11.7個基點

每日經濟新聞 2026-03-21 07:07:03
0 跟貼 0
用豆包做正大杯PPT簡直太輕松了吧

石頭的碎碎念 2026-03-18 21:01:21
0 跟貼 0
六大應用場景全面爆發，地理空間智能從「眼睛」變「大腦」

機器之心Pro 2026-03-20 19:18:41
0 跟貼 0
豆包銳評足球網紅：可可李行，謝宇寧不行！

愛足球的謝宇寧 2026-03-20 06:26:15
5 跟貼 5

賽博禪心

拜AI古佛，修賽博禪心

337文章數 49關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

家居

健康

時尚

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

豆包 2.0 模型發布，全信息整理（全網最完整，另附 79 頁 Model Card）

宇樹招股書拆解，人形機器人出貨量第一！

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

誰在決定字母哥未來？

CMG盛典獲獎名單：章子怡高葉同獲影后

通脹警報拉響，加息潮要來了？

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

時隔四年重磅回歸！小米筆記本Pro 14正式開售：國補價6799.15元起

時空交織 空間綺夢

轉頭就暈的耳石癥，能開車上班嗎？

瞿穎：別催了，不想太紅

伊朗發射3800公里射程的導彈最令美軍戰栗的細節披露

伊朗發射3800公里射程的導彈最令美軍戰栗的細節披露

小鵬汽車2025年Q4盈利凈賺3.8億全年營收767億

時空交織空間綺夢