337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

AI圈怪詞上新:當Harness和Tokenmaxxing一起走紅

0
分享至

AI圈的怪詞又上新了 —— 這次一口氣來了兩個。

一個叫“Tokenmaxxing”,代表一種把Token用量瘋狂刷滿的行為;另一個叫“Harness”,是一套讓 Agent 正確執行任務的工程設計。

這兩個詞最近都很熱,但率先破圈的是 Tokenmaxxing。

這個純看 Token 消耗、帶著點粗暴意味的詞兒,在半個月內被海外AI大廠、黃仁勛、Andrej Karpathy,還有以龍蝦為代表的 Agent 推上風口浪尖。

甚至,最近 AI 圈打招呼的方式,都變成了互問 Token 消耗量。


*Token用盡!

與此同時,在刷量聯歡中,一個名為 Harness 的理念在技術圈流行了起來。

Harness 這單詞的直譯是“馬具”。

這個詞真的很靈。如果把 Agent 比作不聽話的野馬,那 Harness,就是一套讓 Agent 保證任務質量的工程設計。沒錯,它是一套設計框架,不是具體的產品。

某種意義上,它們是 AI 狂飆的一體兩面的產物。Tokenmaxxing 代表縱情燃燒算力的揮霍,Harness 則適時遞上了一條韁繩,試圖把那些無效的消耗拉回正軌。

這兩個看起來都有些怪異,又某種程度上意義相反的概念,在同一個春天火了起來。

Tokenmaxxing,一種新型“身份象征”

Tokenmaxxing,把模型的 Token 用量最大化。這種簡單粗暴的模式之所以成為 AI 新風尚,源于 AI 大廠設置的職場新規,以及黃仁勛、Andrej Karpathy 這類 icon 人物的助推。

幾天前紐約時報的報道,第一次揭露了海外 AI 公司內部員工 Token 消耗排行榜的秘密。

報道中說,Meta、OpenAI、Anthropic 這類公司會把員工近期的 Token 消耗情況列出來,并依據消耗量進行排名。

榜上排名靠前的員工,可能會獲得更多薪酬。還有些公司,會把提供給員工的 Token 預算,當作福利列在牙科保險和免費午餐的旁邊。

以上種種,讓 Token 消耗量成為一種身份象征。

有匿名的 OpenAI 員工表示,自己幾天內消耗了2100億 Tokens,是全公司的榜一大哥。

這個規模,能把整個維基百科的文本逐字瀏覽33遍,把《紅樓夢》的中文版讀上百萬遍,把5000字的論文寫作并修改上億篇...

拿他們自家的 GPT-5.4 輸出價格算一下,這些 Tokens 差不多得花個315萬美元。

身體力行要把 Token 刷爆的代表人物,還有 Andrej Karpathy,這位全球頂流 AI KOL。

他在硅谷著名投資人 Sarah Guo 的播客上說,自己現在不在前沿 AI 實驗室工作,所以把每個月的 Token 消耗拉滿,是一種保持手感的方式,“如果訂閱還有剩余,我會焦慮,說明我沒有最大化我的 token 吞吐量。”

這話一出,立馬引起討論。很多心懷 FOMO 的人覺得,Karpathy 替自己說出了心聲,但還有另外一部分人覺得,他是真的有點...病。


*一篇討論Karpathy“AI病態”的高贊帖子下,有網友點評,瘋狂消耗Token人就像倉鼠一樣在轉輪里瞎忙活。

而黃仁勛,在幾天前的 GTC 大會上把 Tokenmaxxing 這種純卷 Token 的態度直接擺上了臺面。

他說,工程師們應該把Token當作薪酬包的一部分。一個AI工程師,每年至少會消耗價值25萬美元的Tokens。


Token刺客,以及那只燒錢的蝦

至此,Tokenmaxxing 這派已經集齊了 AI 公司、技術 KOL 和算力霸主。這讓它迅速升格為“Token 經濟學”的最潮實踐,也成了一門職場顯學。

一位愛立信駐瑞典的工程師在采訪中說,自己花在 Claude 上的錢已經超過了工資 —— 好在賬單由公司買單。

Shopify 的一位工程師匿名透露:“現在的績效評估表上,有一欄專門問你本周用了多少 AI 工具。”如果數字不夠大,績效就不好看。

Shopify 的 CEO 隨后在 X 上公開了這份內部備忘文件,肯定了員工的 AI 用量確實和績效掛鉤。


*“我們馬上要在績效評估和同事360環評表里,加上一欄專門問你AI用了多少量了。”

不過,隨著 Tokenmaxxing 而來的還有困擾。這套邏輯里最核心的問題是:過于強調消耗量,疏于評估投入產出比。

像 OpenAI 榜一大哥花2100億 Tokens 做的,也并非什么驚天創新,只是一些日常工作而已。

不少重金砸 Token 的人已經感到肉痛。

有在硅谷工作的朋友告訴我,Meta 近期有工程師疑似燒出了百萬美元級別的天價賬單,被主管緊急約談,追問他到底在做什么。

還有風投大佬、8090的聯創 Chamath Palihapitiya 最近也公開發言,說自家公司的 AI 成本自去年底開始瘋漲,逼近年燒1000萬美元,但收入卻沒有同步跟上。“我們的收入并沒有增長三倍,Token 賬單卻增長了三倍。”


ROI 嚴重失衡的背后,Agent 成為了推手。

Chamath Palihapitiya 懷疑,自己公司大量的 Token 賬單來自所謂的 Agent 的循環模式,也就是 Agent 反復給自己喂同一個提示詞,轉了一百圈也沒解決問題,但 Token 消耗量倒是非常好看。

這種體驗,想必各位養蝦人也不陌生。


*過去兩個月,蝦讓很多普通人體會到什么是Token刺客

Harness,駕馭Agent,駕馭AI

當 Tokenmaxxing 在爭議中愈演愈烈,一種更理性的聲音開始出現。

一些人在討論,AI 公司不應該只看工程師的 Token 消耗量,更應該考察他們能否用10M的 Token,完成等效100M Token 的開發。

這個思路聽著靠譜多了。它其實已經指向了 Tokenmaxxing 的對立面——Harness,一個最近在 AI 工程圈爆火,且正在加速破圈的理念。

Harness,直譯是“馬具”。

這個詞選得很妙。Agent 經常和野馬一樣不聽話亂跑,還費錢,而 Harness,就是一套讓 Agent 保證任務質量的工程(馬具)。

設計 Harness 的精髓是,既不把 Agent 限制死,又能確保它跑在正確的軌道上。

關于 Agent、模型、Harness 的關系公式是:Agent = Model + Harness。模型提供智能,而Harness 讓智能變得可用。在具體實踐中,Harness 包含前兩年被強調的上下文工程,又不限于此。


其實早在半年前 Claude Code 風靡時,AI技術圈已經在討論“腳手架” scaffold,一種通過工程手段提升 Agent 效果的模式。


*四木群聊當時討論,不論是Cursor還是ClaudeCode,都在腳手架方面做了很多工作。

今年初,隨著 OpenAI 發布 Codex 實踐,與“腳手架”思路一脈相承的 Harness Engineering 正式成為熱詞。


*原文:

https://openai.com/index/harness-engineering/

本周,Anthropic 在一系列重大更新后,也發布了自己的 Harness 經驗。他們主要講了通過“對抗生成”的思路,讓 Agent 產出更符合預期的網頁結構與交互邏輯。


*原文:

https://www.anthropic.com/engineering/harness-design-long-running-apps

在諸多關于 Harness 的持續解讀中,我覺得字節 Web Infra AI Coding 的負責人周曉總結地挺到位:

他說,Harness Engineering 的核心是給模型好的上下文、好的工具、可讀的環境。

也就是「為 Agent 打造專屬工作室」,用工程手段讓 Agent 發揮出超越模型的價值,減少幻覺、提升效率,保證任務完成的效果。


如果再拆分各家的具體做法,會發現Harness 還沒有統一思路,目前包括不限于以下幾個層面:

上下文工程,這是最基礎的一層。

Agent 的輸出質量,很大程度上取決于它“看到”了什么。塞給它冗余的上下文,會浪費 Token,還會干擾判斷;過于稀薄的上下文,會讓它胡亂發揮。好的 Harness 設計,是在任務執行的不同階段,精準地給 Agent 喂它需要的信息。

記憶與狀態管理,更進階的議題。

多輪任務中,Agent 需要記住“之前做過什么”,但如果每次都把完整歷史塞進上下文,Token 成本會指數級增長。好的 Harness 設計會區分哪些記憶需要持久、哪些只需要在單次任務中保留,從而在保證連貫性的同時,控制消耗。

任務拆解,是保證 Agent “頭腦”清醒的關鍵。

把一個不算簡單的任務拆成研究、 確認方案、執行、驗證等幾個步驟,甚至讓不同的Agent承擔這些工作,效果會更好。

反饋機制,是 Agent 自我進化的核心。

這里的具體操作有:一旦 Agent 出現了重要失誤,就要把這次的教訓記錄進.md文檔里,讓它下次不再犯;以及設置Hook或循環任務,讓它持續自發校驗,直到完成目標。

除此之外,Harness 還涉及效果評估、安全權限等一系列設計。


*海外獨角獸對Harness組件的梳理

由于業務場景差異,不同 Agent 的 Harness 難以形成一套不變的標準方法。但無論落地細節如何變化,Harness 的存在,都恰好制衡了 Tokenmaxxing 式的浪費。

甚至,如果跟著 Harness 的思路,普通人養龍蝦時遭遇的記憶偏差與任務跑偏問題也能緩解。


*根據Harness經驗調整龍蝦的記憶機制

Tokenmaxxing 和 Harness,這組同期走紅的理念,一個鼓勵無節制地消耗,一個追求有質量地控制。

它們共同指向了所謂的“Token 經濟學” —— 這個兩年前被造出來的詞,之前在很多場合被等同于 Token 消耗量,類似于 Tokenmaxxing。

但經濟學的本質,是一門研究“如何在有限資源下做選擇”的學問。如果真討論所謂的 Token 經濟學,那它應該回答的問題不是消耗了多少,而是這些消耗是否值得。

雖然此時 Token 價值的判斷標準還不清晰,但 Harness 起碼給出了一個起點。

畢竟,比起在排行榜上刷出一個聳人聽聞的 Token 數,設計一套方案讓蝦真的能把事情做完,是更值得追求的目標。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
兵推顯示:美日一旦介入臺海,1個月內,中國導彈將帶走過半戰艦

兵推顯示:美日一旦介入臺海,1個月內,中國導彈將帶走過半戰艦

別吵吵
2026-04-13 09:34:07
俄終于攤牌:兩大底牌換中國出手,中方態度成關鍵

俄終于攤牌:兩大底牌換中國出手,中方態度成關鍵

王楔曉
2026-04-12 15:18:02
對戰湖人,火箭隊首發陣容3選1?后場攻守兼備,烏度卡可隨意切換

對戰湖人,火箭隊首發陣容3選1?后場攻守兼備,烏度卡可隨意切換

錢說體育
2026-04-15 11:53:52
震驚,退休母親稱感謝兒子不婚不育,讓我可以無憂享受當下!

震驚,退休母親稱感謝兒子不婚不育,讓我可以無憂享受當下!

黯泉
2026-04-14 13:30:57
駱家輝警告中國:最好不要自主生產尖端芯片,這不是美國想看到的

駱家輝警告中國:最好不要自主生產尖端芯片,這不是美國想看到的

老謝談史
2026-04-12 21:50:08
CBA焦點戰:遼寧力爭2連勝,CCTV5+今晚19-35直播

CBA焦點戰:遼寧力爭2連勝,CCTV5+今晚19-35直播

老淸醫學科普
2026-04-15 11:06:54
浙江男子撿到22萬巨款,還給失主并拒絕酬金,哪料隔天失主說他丟了27萬,讓男子賠5萬,結果大快人心!

浙江男子撿到22萬巨款,還給失主并拒絕酬金,哪料隔天失主說他丟了27萬,讓男子賠5萬,結果大快人心!

背包旅行
2026-04-14 11:34:21
遲重瑞曝光西游記片酬:每集65塊,孫悟空70塊,全劇拍完沒2000塊

遲重瑞曝光西游記片酬:每集65塊,孫悟空70塊,全劇拍完沒2000塊

手工制作阿殲
2026-04-12 14:30:59
陜西女子被丈夫和閨蜜背叛案二審開庭

陜西女子被丈夫和閨蜜背叛案二審開庭

黃河新聞網呂梁
2026-04-14 11:26:44
《錯許流年不逢春》宋詩雨楚屹

《錯許流年不逢春》宋詩雨楚屹

不搭船了
2026-04-10 00:07:12
天啊!看到陳紅1996年新婚的閨房照,才懂陳凱歌為啥說一見鐘情

天啊!看到陳紅1996年新婚的閨房照,才懂陳凱歌為啥說一見鐘情

好賢觀史記
2026-03-02 16:47:20
美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

人生錄
2026-04-10 21:38:01
網約車女司機,困于難言之隱

網約車女司機,困于難言之隱

視覺志
2026-04-14 08:39:59
勇士主帥科爾談對陣快船策略:嚴防倫納德&切斷加蘭與隊友串聯

勇士主帥科爾談對陣快船策略:嚴防倫納德&切斷加蘭與隊友串聯

錢說體育
2026-04-15 11:24:37
現役無冠球員季后賽勝場數:哈登無懸念第一 威少巴特勒上榜

現役無冠球員季后賽勝場數:哈登無懸念第一 威少巴特勒上榜

驚奇侃球
2026-04-15 01:03:20
大逆襲!大黑馬加時準絕殺:全場狂歡慶祝,新星三分6中0落寞

大逆襲!大黑馬加時準絕殺:全場狂歡慶祝,新星三分6中0落寞

體壇小李
2026-04-15 10:32:42
美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

蜉蝣說
2026-04-15 10:55:59
渣滓洞最“傻”的女烈士:押送路上,為保護戰友她拒絕了生的機會

渣滓洞最“傻”的女烈士:押送路上,為保護戰友她拒絕了生的機會

何氽簡史
2026-04-14 17:01:22
2026年NBA自由市場盤點:這25條大魚花落誰家?湖人首發三人上榜

2026年NBA自由市場盤點:這25條大魚花落誰家?湖人首發三人上榜

仰臥撐FTUer
2026-04-14 08:07:02
洗完澡千萬不要順手洗內褲,提醒:這2個清洗誤區,很多人都犯了

洗完澡千萬不要順手洗內褲,提醒:這2個清洗誤區,很多人都犯了

白話電影院
2026-04-12 13:13:58
2026-04-15 12:24:49
四木相對論 incentive-icons
四木相對論
嘮嘮科技,看看世界
127文章數 2關注度
往期回顧 全部

科技要聞

手機無死角上網?亞馬遜砸百億硬剛馬斯克

頭條要聞

媒體:蘇林剛到北京就乘坐高鐵 不難看出是為了什么

頭條要聞

媒體:蘇林剛到北京就乘坐高鐵 不難看出是為了什么

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊道歉”

娛樂要聞

曾志偉辦73歲生日派對,逾百藝人到場

財經要聞

特朗普稱美國對伊朗的戰爭已經結束

汽車要聞

海豹08內飾首秀 大滿配“海王”旗艦

態度原創

家居
藝術
親子
教育
軍事航空

家居要聞

簡而不減 暖居之道

藝術要聞

這山水,蕩滌胸中塵埃

親子要聞

你為何記不起嬰兒期時光?

教育要聞

剛剛,山東又有2市確認中小學春秋假時間

軍事要聞

萬斯:對當前美伊局勢進展“感到樂觀”

無障礙瀏覽 進入關懷版