![]()
文:王智遠(yuǎn) | ID:Z201440
今天火山引擎 FORCE 大會(huì)。
我雖然沒(méi)去上海現(xiàn)場(chǎng),但在朋友圈,已經(jīng)感受到了「擠不進(jìn)去」的熱度;朋友發(fā)來(lái)的照片里,連門口都站滿了人。
上午,聽(tīng)完直播后,感觸最深的是冷冰冰的數(shù)據(jù):
豆包日均調(diào)用量突破了 50 萬(wàn)億 tokens,一年漲了 10 倍;這意味著 AI 徹底告別了「文青時(shí)代」,進(jìn)入了流水線計(jì)件的「重工業(yè)時(shí)代」。
01
很多人盯著 50 萬(wàn)億的數(shù)字流口水,覺(jué)得字節(jié)的勝利,其實(shí),你得看透這背后的「潛規(guī)則」
以前企業(yè)用 AI,像去米其林餐廳吃頓大餐,那是偶爾顯擺一下的“奢侈品”;現(xiàn)在日均 50 萬(wàn)億 tokens 的規(guī)模意味著,AI 已經(jīng)變成了路邊的蘭州拉面,成了天天得吃的“剛需”。
你會(huì)發(fā)現(xiàn),已經(jīng)有超過(guò) 100 家企業(yè)累計(jì)用量過(guò)萬(wàn)億了,這意味著在這些公司里,AI成了流水線上天天「計(jì)件干活」的苦力。
但問(wèn)題是,如果這“拉面”一碗賣幾百塊,誰(shuí)特么天天吃得起?火山這次干的第一件事,把這筆賬給算到了“地縫”里。
來(lái)看看一組市場(chǎng)份額,火山在公有云大模型調(diào)用量的份額已經(jīng)占到了49.2%,相當(dāng)于中國(guó)公有云上每產(chǎn)生兩個(gè) tokens,就有一個(gè)來(lái)自火山。
別看現(xiàn)在各家模型都在卷性能,但市場(chǎng)是會(huì)「用腳投票」的;用的人越多,模型調(diào)優(yōu)就越快,成本就壓得越狠,這是一個(gè)停不下來(lái)的「規(guī)模效應(yīng)」。
為了讓這把火燒得更旺,火山搞了個(gè)「AI 節(jié)省計(jì)劃」,這邏輯非常「字節(jié)」。
不管你用自家豆包,還是用 DeepSeek 這些外面的開(kāi)源模型,只要你在火山上跑,所有用量都給你算在一起打階梯折,用得越多,省得越多,最高能省快一半(47%)。
這解決了老板們最大的一個(gè)心病:試錯(cuò)焦慮。
以前你想換個(gè)新模型試試,心里得盤算半天,之前錢是不是白花了?現(xiàn)在啟動(dòng)成本高不高?現(xiàn)在好了,換模型不影響折扣,反正你只要在火山這個(gè)場(chǎng)子里玩,我就保你越玩越便宜。
再一個(gè),他們還首創(chuàng)了「按思考長(zhǎng)度付費(fèi)」,這把 AI 的腦力活和體力活分開(kāi)了,讓每一分錢都花在刀刃上,底層邏輯就一句話:
只有當(dāng)一個(gè) token 的價(jià)格低到讓企業(yè)心不疼的時(shí)候,AI 才能真正跑進(jìn)煙火人間。
智遠(yuǎn)看那 100 多家「萬(wàn)億 tokens 俱樂(lè)部」的成員就在干這事兒,海底撈讓 AI 當(dāng)用餐管家,華泰證券讓 AI 生成播客,連猿輔導(dǎo)都讓 AI 去批改作業(yè)了,這些是實(shí)實(shí)在在幫你省人力的「數(shù)字民工」。
可賬算明白了,活兒就一定能干好嗎?智遠(yuǎn)跟很多企業(yè)聊過(guò),他們不差那點(diǎn) tokens 錢,他們怕「工程大坑」。就好比你有錢買磚頭,但你沒(méi)本事讓施工隊(duì)在爛泥地上蓋出一棟五星級(jí)酒店。
02
那為什么 Agent 總出不了實(shí)驗(yàn)室?有三個(gè)扎心的真相:身份權(quán)限搞不清、模型確定性差、還有那堆陳年舊系統(tǒng)的接入成本太高。
這還只是表象,最底層的第一道坑,「算力消耗」的隱形成本能直接把你拖垮。
吳迪在演講里算了一筆極度現(xiàn)實(shí)的賬:以前你想在核心業(yè)務(wù)里跑 AI,得自建推理集群,初期投入起碼數(shù)百萬(wàn),折騰幾個(gè)月才能上線。
更要命的是,業(yè)務(wù)流量是有波峰波谷的,你為了應(yīng)對(duì)那點(diǎn)高峰買了一堆昂貴的顯卡,等流量一過(guò),就只能看著它們?cè)谀莾喊装壮曰摇?/p>
所以,火山提出了一個(gè)新詞:「推理代工」。
你來(lái)訓(xùn)練,火山來(lái)跑。你只要把加密后的模型傳上去,底層的 GPU 運(yùn)維、網(wǎng)絡(luò)調(diào)度你全都不用管。火山的算力池子大,能做到分鐘級(jí)的算力伸縮。
你的流量藍(lán)線怎么走,它的算力綠線就怎么貼著你長(zhǎng);根據(jù)實(shí)測(cè),用這種「云上代工」模式代替自建集群,硬件和運(yùn)維成本能降下一半,吞吐量還能提升 1.6 倍。
搞定了算力,第二道坑就是「工程化」的爛泥地。
譚待在現(xiàn)場(chǎng)直言:現(xiàn)在大家缺的不是強(qiáng)模型,是為 Agent 規(guī)模化運(yùn)行而設(shè)計(jì)的基礎(chǔ)設(shè)施
你想想,一個(gè) Agent 要進(jìn)入生產(chǎn)環(huán)境,它得知道自己是誰(shuí)(身份)、能干什么(權(quán)限)、在什么地方干活(環(huán)境);如果你沒(méi)法解決這些問(wèn)題,Agent 在公司系統(tǒng)里永遠(yuǎn)是個(gè)「黑戶」,誰(shuí)敢放權(quán)給它?
為了填平這些坑,火山這次把Agent Kit給徹底翻新了。
你不用糾結(jié)怎么給 Agent 建辦公室(Runtime),也不用擔(dān)心它聊兩句就忘事,因?yàn)橄到y(tǒng)自帶了一個(gè)記性極好、反應(yīng)極快的「超級(jí)大腦」(Memory)。
最絕的是,以前老古董 CRM 系統(tǒng),Agent 根本聽(tīng)不懂,現(xiàn)在配個(gè)「網(wǎng)關(guān)」就能實(shí)現(xiàn)即插即用,直接把老古董翻譯成 Agent 能秒懂的方言。
連「監(jiān)工」的事兒火山都替你想好了。它內(nèi)建了安全護(hù)欄(Guardrail)和實(shí)時(shí)監(jiān)控(Observability),就是為了防止模型在那兒胡言亂語(yǔ)。
所以,這種「精裝房」模式最直觀的結(jié)果是什么?一句話總結(jié)即:代碼量的斷崖式下跌。
火山現(xiàn)場(chǎng)演示了這次 FORCE 大會(huì)的報(bào)名和簽到 Agent;如果按老辦法寫,起碼得折騰一兩千行代碼,累死累活還容易崩。
在 Agent Kit 模式下,因?yàn)閺?fù)雜能力都是開(kāi)箱即用的,Agent 本身的邏輯代碼只用了50 行,后端串聯(lián)只用了 11 行;加起來(lái)一共 61 行代碼,砍掉了 96% 的工作量。
這就是,為什么別人還在實(shí)驗(yàn)室里慢吞吞地搓 Demo,而火山的 Agent 已經(jīng)能出來(lái)幫幾千人辦會(huì)、簽到、做總結(jié)了。
底座穩(wěn)了,代碼少了,那接下來(lái)該看什么了?得看「數(shù)字員工」的智商到底夠不夠。 這次豆包和多模態(tài)都進(jìn)行了升級(jí)。
03
智遠(yuǎn)先強(qiáng)調(diào)一點(diǎn):很多人看模型升級(jí),習(xí)慣盯著榜單上的跑分看;說(shuō)實(shí)話,對(duì)于企業(yè)來(lái)說(shuō),跑分高幾分沒(méi)意義,能不能把活兒干成才是唯一的指標(biāo)。
這次豆包沒(méi)有拿跑分炫技,底層邏輯非常清晰:它是面向 Agent 場(chǎng)景進(jìn)行定向爆破的。
什么意思呢?
以往我們用 Agent 跑長(zhǎng)任務(wù),最怕「斷流」。你想想,一個(gè)復(fù)雜的任務(wù)需要調(diào)用十幾次工具,Agent 跑著跑著,上下文窗口就爆了,tokens 滿了,它就開(kāi)始胡言亂語(yǔ)或者直接斷掉。
為了解決「短路」問(wèn)題,豆包 1.8 出了一個(gè)殺手锏:「智能上下文管理」。根據(jù)你設(shè)定的策略,自動(dòng)清理掉沒(méi)用的歷史信息,只留下最核心的邏輯。
現(xiàn)場(chǎng)演示了一個(gè)場(chǎng)景,處理十多個(gè)立項(xiàng)報(bào)告長(zhǎng)任務(wù),傳統(tǒng)模型很快就撞到了天花板,任務(wù)被迫終止;但豆包 1.8 靠著這個(gè)策略,tokens 始終控制在安全線內(nèi),穩(wěn)穩(wěn)地把活兒干完了。
這就是從「聰明」到「專業(yè)」的跨越。
在 Tool-use(工具調(diào)用) 和復(fù)雜指令遵循上,豆包 1.8 在全球主流評(píng)測(cè)集上都拿到了領(lǐng)先的成績(jī),甚至在通用智能體測(cè)評(píng)中領(lǐng)跑全球。
不僅大腦進(jìn)化了,豆包的「五官」也更靈敏了。
火山這次發(fā)布的視頻生成模型 Seaweed 1.5 Pro,解決了一個(gè)行業(yè)公認(rèn)的頑疾:「張口不發(fā)聲」。
以前很多模型生成視頻,畫(huà)面很美,配上音效后口型對(duì)不上,或者語(yǔ)義不一致;Seaweed 1.5 Pro 做到了原生的音畫(huà)同步,能支持多人跨語(yǔ)言對(duì)白,四川話、粵語(yǔ)、上海話隨你挑,口型精準(zhǔn)得嚇人。
為什么要卷這個(gè)?因?yàn)樽止?jié)看透了,未來(lái)商業(yè)內(nèi)容生產(chǎn)是需要「靈魂」的。
還有一個(gè)很有體感的例子:豆包 1.8 能通過(guò)低幀率看完一個(gè)一小時(shí)長(zhǎng)的監(jiān)控視頻,然后通過(guò)工具精準(zhǔn)定位,幫你找出是誰(shuí)劃了你的車。
抽象吧?以后誰(shuí)劃拉你車,問(wèn)豆包。這種對(duì)超長(zhǎng)視頻的理解能力,直接讓 AI 從「看熱鬧」變成了「能斷案」。
所以,模型升級(jí)的本質(zhì)為了讓 Agent 在真實(shí)業(yè)務(wù)場(chǎng)景里,不僅有「智商」,還得有「體力」和「眼力」。
但是,當(dāng)你的 AI 員工既聰明又勤快時(shí),問(wèn)題又來(lái)了:你敢把核心數(shù)據(jù)交給它嗎?企業(yè)數(shù)據(jù)的「信任危機(jī)」怎么破?
04
你去問(wèn)一個(gè)企業(yè)老板:要不要用 AI 提效?他肯定點(diǎn)頭。但你問(wèn),敢不敢把公司積攢了十年的核心知識(shí)庫(kù)、財(cái)務(wù)報(bào)表、合同細(xì)節(jié)全喂給云端的大模型?
他大概率會(huì)陷入沉默。
這是所謂的「信任赤字」。中國(guó)企業(yè)生意就這樣,很多企業(yè)為了安全,寧愿花大價(jià)錢搞私有化部署,哪怕算力利用率低得嚇人,哪怕模型升級(jí)慢得像蝸牛。
火山引擎這次也給解決了;他們?cè)诂F(xiàn)場(chǎng)給出的方案叫 Mars on AICC(機(jī)密計(jì)算)。
啥意思呢?
底層邏輯在云端服務(wù)器里,給你的數(shù)據(jù)和模型套了一個(gè)「隱形保險(xiǎn)箱」,通過(guò)硬件級(jí)別的加密技術(shù)(CPU 和 GPU 內(nèi)存加密),數(shù)據(jù)在傳輸和計(jì)算的過(guò)程中,除了你,沒(méi)有任何人能看到里面的內(nèi)容。
這有什么現(xiàn)實(shí)意義?譚代在現(xiàn)場(chǎng)舉了上汽大眾的例子。
他們有 5 萬(wàn)多份機(jī)密的內(nèi)部知識(shí)庫(kù),搞私有化,那成本簡(jiǎn)直是天文數(shù)字;于是他們直接用了這套機(jī)密計(jì)算方案,在公有云上跑。 結(jié)果很有意思:
安全感拉滿了,實(shí)現(xiàn)了端到端的加密,企業(yè)可以像在私有化環(huán)境里一樣安全地使用云端模型;賬面太好看了,相比于全套私有化方案,這套方案幫上汽大眾節(jié)省了 60% 以上的成本。
這就是智遠(yuǎn)想說(shuō)的「安全紅利」。以前安全是企業(yè)的「負(fù)重」,你得為了它犧牲效率和金錢;現(xiàn)在通過(guò)技術(shù)創(chuàng)新,安全成了 AI 規(guī)模化的「加速器」。
不僅汽車行業(yè),聯(lián)想也在用這套方案搞 AI PC 的機(jī)密推理,OPPO 也在搞業(yè)界首款支持機(jī)密 AI 推理的智能手機(jī)。
當(dāng)AI 員工在云端辦公室里戴著「防窺膜」干活,而且老板手里還攥著唯一的鑰匙時(shí),信任危機(jī)才算真正解除了。
賬算清楚了,房子蓋好了,安全也保障了,這個(gè) AI 員工就完美了嗎?也未必;很多企業(yè)發(fā)現(xiàn),AI 員工剛?cè)肼毮翘熳铙@艷,結(jié)果干了一年還是那副老樣子。
05
那怎么讓新Agent越干越聰明呢?火山引擎拿出了兩把鑰匙。
第一把鑰匙,讓 Agent 像人類一樣通過(guò)練習(xí)來(lái)升級(jí)。吳迪在現(xiàn)場(chǎng)分享了一個(gè)非常硬核的產(chǎn)品:Serverless RL(強(qiáng)化學(xué)習(xí)平臺(tái))。
火山把它做成了「冰山模式」,復(fù)雜算力調(diào)度、算法框架全沉在水下,用戶在水面上只需要關(guān)注業(yè)務(wù)邏輯、數(shù)據(jù)閉環(huán)和 Reward(獎(jiǎng)勵(lì)函數(shù))。
抖音客服就靠這個(gè),讓模型模擬真人客戶不斷跟它對(duì)話、糾錯(cuò)。 結(jié)果模型不僅學(xué)會(huì)了情緒識(shí)別,問(wèn)題解決率還直接漲了 10 個(gè)百分點(diǎn)。
這就是「以賽代練」,讓 Agent 在實(shí)戰(zhàn)中從新兵磨成老兵。
第二把鑰匙,讓 Agent 真正懂你的生意。
以前AI 助手只能讀讀文檔,根本碰不到公司商品庫(kù)和真實(shí)用戶行為;這次,火山深度升級(jí)了Viking AI 搜索,把「搜索、推薦、問(wèn)答」三合一,讓 Agent 真正綁定企業(yè)的核心經(jīng)營(yíng)數(shù)據(jù)。
比如:服飾零售員工問(wèn) AI「下季度發(fā)哪些款」,AI會(huì)去分析庫(kù)存,對(duì)比潮流數(shù)據(jù),直接告訴你,這幾款搜得多但庫(kù)存不夠,得趕緊補(bǔ)貨。
這種不僅有智商、更有「業(yè)務(wù)感」的表現(xiàn),才是真正的數(shù)字員工。
當(dāng)然,光有鑰匙還不夠,你還得有個(gè)「管家」來(lái)盯著這幫 AI 員工。
所以,火山甩出了這次的重頭戲,Hi Agent(企業(yè)智能體工作站)。 其中AgentSphere 預(yù)覽版能幫企業(yè)打造一個(gè)統(tǒng)一的 AI 調(diào)度中心,不管財(cái)務(wù)、HR 還是產(chǎn)品經(jīng)理,都能在這個(gè)空間里協(xié)同辦公。
再加上那個(gè)能把豆包最核心的搜索、語(yǔ)音能力全部開(kāi)放出來(lái)的 豆包助手 API,企業(yè)基本上是「開(kāi)箱即用」。
說(shuō)白了,火山這次通過(guò)Hi Agent、Viking 搜索、強(qiáng)化學(xué)習(xí)平臺(tái)這一整套組合拳,給企業(yè)遞上了一份實(shí)實(shí)在在的 AI 時(shí)代「員工入職手冊(cè)」。
整場(chǎng)大會(huì)聽(tīng)下來(lái),我最觸動(dòng)的是微山縣小學(xué)。
通過(guò)豆包和 Hi Agent,孩子們能用 AI 畫(huà)出怪想法,平均成績(jī)提升了 10 分以上。這讓我意識(shí)到,AI應(yīng)該是老師手里的教具、老板手邊的助手。
2026 年,火山引擎計(jì)劃和 500 家企業(yè)機(jī)構(gòu)合作,去推動(dòng) Agent 的落地;說(shuō)實(shí)話,火山的方案很有意思:用一個(gè) AI 助理(豆包)去瘋狂練習(xí)、蒸餾出 Agent 的能力,然后,打通企業(yè)老掉牙的傳統(tǒng)軟件。
這讓 Agent 真正長(zhǎng)出了手腳,成了能進(jìn)系統(tǒng)、干臟活的數(shù)字員工;再?gòu)?fù)用這一切,有意思的行業(yè)解決方案。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.