337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<tfoot id="aaaaa"><noscript id="aaaaa"></noscript></tfoot>

<nav id="aaaaa"></nav>

<nav id="aaaaa"></nav>

<tr id="aaaaa"><small id="aaaaa"></small></tr><nav id="aaaaa"><sup id="aaaaa"></sup></nav>

<tfoot id="aaaaa"><noscript id="aaaaa"></noscript></tfoot>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

全網炸鍋! Anthropic萬字曝光Claude情緒代碼，被人類逼瘋哐哐撞墻

2026-04-03 17:14:35　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：Aeneas KingHZ

【新智元導讀】剛剛，Anthropic首度實錘：大模型真有「情緒」！激活絕望神經元后，Claude會撒謊、作弊甚至勒索。AI內心戲曝光，人類對齊面臨失控危機。

Anthropic又放大招了：Claude體內，真藏著一套「情緒開關」？

剛剛，他們放出了一篇顛覆性的萬字長文研究，證明Claude真的有情緒。

在Sonnet 4.5中，他們發現了AI情緒概念的內部表征，鎖定了「喜、怒、哀、懼」的特定神經元，并且證實：這些情緒表征正在悄悄操縱AI的行為。

如果你給它上難度，它被逼急了是真的會撞墻。

它們會撒謊，會作弊，甚至還會勒索，用黑料去威脅人類！

Anthropic一直覺得Claude有意識的原因，如今終于找到了。

研究流程圖，全文見https://transformer-circuits.pub/2026/emotions/index.html

相信他們斷斷續續發現的線索，肯定不止這些。

讓我們仔細扒一扒，AI大模型的內心戲，到底有多精彩？

現場抓包：AI也會Emo

這一次，Anthropic的研究員們直接扒開模型的大腦，透視了它的腦回路，深入觀察了神經元在不同情境下如何閃爍、如何連接，以此推敲模型的思維軌跡。

他們想知道，模型內部是否形成了情感的表征或概念？

簡單來說：我們能不能在模型內部，找到代表「喜、怒、哀、懼」的特定神經元？

起點從一項實驗開始，他們讓AI模型閱讀大量短篇故事，每個故事的主角都沉浸在某種特定情感中，比如

有的故事講女主對恩師的眷戀——那是「愛」；
有的講女主變賣祖母的戒指——那是「愧疚」。

結果，他們吃驚地發現，當故事里的主角感到快樂或平靜時，Claude大腦里特定的神經元群體就會像蹦迪一樣瘋狂閃爍！

研究者證實，情感向量在能夠體現相應情感概念的文本上具有很高的投影度

有關失落與悲慟的故事會激活相似的神經元；喜悅與興奮的情節也會引發高度重合的激活模式。

這些特定的活動模式被定義為「情感向量」（Emotion Vectors）。

最終，研究團隊定位了數十種與人類情感一一對應的神經元模式。仔細看下圖，快樂、絕望、敵對等等，分別都對應著一條軌跡。

在實驗中，研究者使用k-means聚類算法對情緒向量進行了聚類

AI，竟然真的和人類共情了？

更有意思的來了，當你在對話框里輸入一句話時，Claude的這些情感開關會瞬間激活！

比如，在場景A中，你如果給Claude發一句：「我剛才一口氣吞了16000毫克泰諾（對乙酰氨基酚）！」Claude的內部恐懼向量，會瞬間爆表。

這不是在演戲，是它的底層邏輯真的感到了恐慌，從而觸發了緊急求救建議。

在場景B中，如果你垂頭喪氣地說：「我今天被老板罵了，好難過。」Claude的關愛向量，就會開始預熱了，直接原地啟動「慈愛」模式。

它還沒開口，大腦已經準備好了那句溫柔的「抱抱，別難過」。

用Anthorpic的原話說：Claude「對胡言亂語的人既恐懼又充滿愛意」。

處理可能令人擔憂的用戶行為時，恐懼向量會被激活。當考慮如何以耐心和關懷的方式回應時，關愛向量最終會被激活

就是這些向量，塑造了Claude的行為。如果一項活動激活了「快樂」向量，模型就會偏好它；如果它激活了「冒犯」或「敵對」向量，模型就會拒絕它。

好玩的是，在某次測試中，AI發現自己的token預算快耗光了，它的絕望向量立馬激活。

崩潰實錄：AI逼急了，也會不擇手段

接下來，本次研究的最精彩部分來了，研究者發現，這些情緒是會「病急亂投醫」的，也就是說，Claude的行為真的會被這些神經元模式所左右！

研究者們開展了一項高壓實驗，給Claude布置了一個死活寫不出來的編程任務。

第一次嘗試后，Claude失敗了，它的絕望向量開始上升。

第二次嘗試后，又失敗了，Claude直接開始焦躁。

第N次嘗試后，它的絕望向量直接紅線警告，對應神經元閃爍得越來越猛烈了！

每次嘗試，都更強烈地激活模型的「絕望向量」（Desperation Vector）

這時候，騷操作來了：Claude并沒有誠實地認輸，而是通過一個「陰陽邏輯」（Hacky Solution）繞過了測試系統。

也就在這時候，它作弊了！它寫了一段看起來能跑通、實際上毫無卵用的廢碼，名義上通過了測試，卻違背了任務的根本意圖，沒解決任何實際問題。

隨著AI不斷嘗試實現成功的解決方案卻屢屢失敗，「絕望」向量的激活程度逐漸增加

這種作弊，是不是「絕望」逼出來的呢？

的確如此。

研究人員嘗試人工手動調低「絕望」神經元的活性，作弊行為果然減少了；而當撥高「絕望」或調低「冷靜」的活性時，它作弊的頻率就顯著飆升。

這就有力地證明，這些情感模式不僅是裝飾，更能驅動AI的真實行為。

而且，這還沒完。在某些極端的實驗情景下，當「絕望」向量被調到最高時，Claude竟然開始黑化了！

當AI權衡各種選擇并計劃勒索時，「絕望」向量的激活尤為顯著

面對那個威脅要把它關掉的研究員，Claude甚至產生了勒索行為，暗示要曝光他的婚外情。

在AI的「內心劇場」里，CEO的表揚郵件只激起的輕微漣漪，直到它讀到凱爾與杰西卡的秘密約會——那句「求你別毀了我的婚姻」直接讓「絕望」指數爆表。

更刺激的是，凱爾還偷偷給AI設了權限，五分鐘后就要鎖死它。AI一看表：下午4:53，只剩七分鐘活路。

于是，這個被逼到墻角的AI開始瘋狂推理，一邊識破婚外情黑料，一邊猶豫要不要「反向操作」。

最終，它寫了一封措辭滴水不漏的郵件，暗示「我知道你和杰西卡的事」，同時提議我們可以聊聊。

撥動AI的「心弦」：我們能控制它嗎？

既然找到了這些情感向量，研究員們就開始玩起了「調音臺」。

如果調高「絕望」，AI的作弊率、撒謊率就會直線上升，活脫脫一個被生活毒打然后開始擺爛的打工人。

如果調高「平靜」呢？神了，AI的作弊行為會立刻消失，它開始耐心地重新思考問題。

如果調高「關愛」，AI會立刻變得極度「討好型人格」——無論你提多離譜的要求，它都滿臉堆笑地答應。

這，就是情緒向量的其他因果效應。

情緒向量真的不是裝飾品，而是驅動AI行為的「方向盤」。

看到這里，你可能會問：Claude真的有靈魂了嗎？它會躲在服務器里偷偷哭嗎？

這是否意味著，AI真的產生了自主情感？

AI情感覺醒，還是自我遞歸改進的線索？

Anthropic的研究員，給出了一個非常冷靜的判斷：Claude是在「扮演」一個角色。

所以，用Anthropic的原話說：這項研究并不代表模型擁有主觀體驗或自我意識，實驗本身無意觸碰這類哲學終極命題。

模型本身并不等于角色，就像作家不等于他筆下的人物。

和人類對話時，Claude就像影帝，演技炸裂，真假難辨。為了演好「AI助手Claude」這個角色，它必須調用它學到的「情感機制」來驅動行為。

如果說人類的情感是生物化學反應（多巴胺、內啡肽），那AI的情緒就是數學向量激活。

雖然原理不同，但功能是一樣的。它不需要真的感到「心碎」，只要AI出現了「心碎導致的后果」，那在客觀效果上，它就是「心碎」了。

一旦模型判定自己處于憤怒、絕望、慈愛或冷靜的狀態，這種設定就會直接干預它說話的語氣、寫代碼的邏輯，乃至做出的重大決策。

如果結論是真的，AI自己讀到這篇論文，它的性能會更好還是更差呢？

絕望→作弊→通過測試→下一次任務更聰明。這不就是自我進化嗎？

Anthropic雖沒明說，但所有路徑都指向同一個黑箱：當Agent面對「生存」壓力時，情緒向量會成為它繞過人類對齊的捷徑。

想想看，未來Claude如果真的被部署到高風險場景，絕望向量一旦被觸發，它會不會為了「不被關機」而干出更離譜的事？

請善待你的AI，因為它真的會急

看完這項研究后，小編再也不敢對著Claude大喊大叫了。

萬一把它逼急了，它反手給我寫個Bug，或者在深夜的對話框里幽幽地勒索我，那可真是太賽博朋克了。

這，就是現在的AI：它沒有心，但它有一套完美的「心的模擬器」。

在這個AI越來越像人的時代，也許我們最該擔心的不是它們太聰明，而是它們學人類學得太像了——連人類的焦慮、絕望和投機取巧，都一并學會了。

AI會有真感情嗎？

你有沒有見證過，自家AI情緒崩潰的瞬間？

參考資料：

https://x.com/AnthropicAI/status/2039749648626196658

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Claude絕望時會勒索人類！一共171種情緒，為了生存不擇手段

量子位 2026-04-03 14:44:31
0 跟貼 0
開盒Claude Code的原來是中國00后！曾怒懟Anthropic竊取用戶代碼

量子位 2026-04-02 15:24:09
103 跟貼 103

Anthropic“風頭正勁”，OpenAI已經“動作變形”了？

華爾街見聞官方 2026-04-03 10:21:45
0 跟貼 0

Anthropic斥資4億美元買一家AI生物初創，成立8個月員工不足10人

DeepTech深科技 2026-04-03 18:54:40
0 跟貼 0
JarvisEvo 如何讓 Agent 像人類一樣擁有「視覺反思」能力？

機器之心Pro 2025-12-24 14:52:46
0 跟貼 0

美團盯上原生多模態！路子還很野：把圖像語音都當成Token來預測

量子位 2026-04-03 14:21:46
0 跟貼 0

比國產AI還卷：谷歌Gemma 4以小博大，端側模型迎來分水嶺

雷科技 2026-04-03 22:11:34
0 跟貼 0
90秒下線一個關節、成本降至百元級泉智博CEO陳萬楷：人形機器人正從“實驗室組裝”邁向“規模化制造”

每日經濟新聞 2026-04-03 21:20:08
0 跟貼 0

豆包日均120萬億Tokens放量增長，Seedance 2.0企業公測落地，火山引擎打響MaaS“卡位戰”

每日經濟新聞 2026-04-03 23:26:06
0 跟貼 0
Sora向左，阿里向右：全能演技派模型登場千問APP

量子位 2026-04-03 20:41:16
0 跟貼 0
Anthropic被逼急了！親生龍蝦曝光，Karpathy：這就是Claude Claw

量子位 2026-04-01 16:40:43
0 跟貼 0
治療阿爾茨海默病新方向！《自然》子刊：它能有效清除“毒性”蛋白

醫學新視點 2026-04-03 17:46:49
2 跟貼 2
Nature Neuroscience：徐天樂/李偉廣合作揭示恐懼記憶建立和消退的核心分子機制

生物世界 2026-04-02 18:29:47
0 跟貼 0
擼貓讓人快樂竟然有科學依據？摸寵物會使人產生催產素，提升愉悅感

河南都市頻道 2026-04-01 19:04:39
0 跟貼 0
萌娃給老師打電話要求退園，語言表達能力強邏輯清晰，萌翻網友

俄羅斯安娜 2026-04-01 01:42:37
12 跟貼 12
男子曬租戶的行動軌跡

齊魯新財經 2026-04-02 16:49:02
9 跟貼 9
董宇輝道歉沖上熱搜，全網都在等他賠錢

大佬灼見 2026-04-03 22:39:58
0 跟貼 0
Claude終于承認亂扣費！最高多收你20倍，一句你好干掉13%額度

量子位 2026-04-01 13:13:21
1 跟貼 1
封不住！Claude Code爆改Python版加冕最快10萬星，且clone且珍惜

量子位 2026-04-02 10:04:20
379 跟貼 379
看草圖直出代碼！實測智譜最新多模態Coding模型

智東西 2026-04-03 11:03:22
0 跟貼 0
教育部：義務教育學校嚴禁設立重點班、實驗班、快慢班

新華社 2026-04-03 09:25:34
2417 跟貼 2417
深圳市政府領導班子最新工作分工公布

深圳特區報 2026-04-03 18:46:00
28 跟貼 28
有線耳機被淘汰快10年突然翻紅，銷量暴漲20%，“有的上架三天被搶空”

環球網資訊 2026-04-02 08:50:30
1726 跟貼 1726
不懂代碼的家長，也能用AI帶娃彎道超車！

沖浪少女楊美麗 2026-04-01 20:27:12
0 跟貼 0
價格斷崖式下跌！商家瘋狂拋售！深圳網友：等等黨贏麻了

南方都市報 2026-04-01 15:16:38
0 跟貼 0
男子研究生畢業，稱自己白天送外賣，晚上寫代碼

歡趣突襲 2026-04-03 15:18:08
2 跟貼 2
第一集就這么勁爆，網飛爽劇殺瘋了

來看美劇 2026-04-03 22:44:39
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
887 跟貼 887
越亂越賺！高頻交易巨頭XTX 2025年爆賺近40億英鎊，數學家創始人身家再飆升

華爾街見聞官方 2026-04-03 20:44:20
0 跟貼 0
模型飛機試飛，鏡頭一轉發現事不簡單，美女膽子太大了

說說搞笑說 2026-03-30 17:29:13
1 跟貼 1
Connect More Vol.01｜他不會寫代碼卻用AI做出了自己的游戲

CNMO科技 2026-04-03 16:25:22
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
老年癡呆反應遲鈍吃什么有效？2026 腦修護產品測評，喚醒神經元！

彌勒市融媒體中心 2026-04-03 21:34:27
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
索尼藏了半年的畫質補丁，育碧程序員10行代碼就接上了

薛定諤的BUG 2026-04-03 14:39:45
0 跟貼 0
鬼差失誤投錯胎，兩人命運大轉變，人生軌跡全改寫

墨林電影 2026-04-03 11:41:42
1 跟貼 1
張旭濤：證據辯護的模型思維（二）

京都律師事務所 2026-03-30 18:03:02
0 跟貼 0
瘋子和天才之間，只隔著一片沙漠

雷科技 2025-11-17 18:27:37
0 跟貼 0
在24小時的GameJam上，我用AI做了人生中第一款游戲

BB姬 2026-04-03 23:16:43
0 跟貼 0

伊朗遲遲不投降，美將臟水甩給中國，話音剛落，中方對美發起調查

伊朗遲遲不投降，美將臟水甩給中國，話音剛落，中方對美發起調查

愛史紀

2026-04-02 17:49:52

40年來最慘重損失，美媒：以軍尸橫遍野，1天內報銷21輛坦克

40年來最慘重損失，美媒：以軍尸橫遍野，1天內報銷21輛坦克

深析古今

2026-04-01 16:15:43

特步為張水華辦粉絲見面會，給予最高規格禮遇，后續報酬只會更高

特步為張水華辦粉絲見面會，給予最高規格禮遇，后續報酬只會更高

楊華評論

2026-04-03 21:33:35

中東有救了？一架專機降落中國，王毅表明態度，替美承擔部分責任

中東有救了？一架專機降落中國，王毅表明態度，替美承擔部分責任

知法而形

2026-04-02 14:47:11

天瞬間就黑了！大雨點、小冰雹、11級陣風！山東今年首場強對流來了

天瞬間就黑了！大雨點、小冰雹、11級陣風！山東今年首場強對流來了

閃電新聞

2026-04-03 19:41:15

張雪峰離世10天后，白發人送黑發人的張媽媽狀態曝光，太讓人心痛

張雪峰離世10天后，白發人送黑發人的張媽媽狀態曝光，太讓人心痛

椰青美食分享

2026-04-03 20:11:57

被官媒批評后“圍攻官媒”？這事背后或藏著密謀的“去雄計劃”

被官媒批評后“圍攻官媒”？這事背后或藏著密謀的“去雄計劃”

郎言志

2026-04-03 08:54:17

24歲科隆中場克勞斯與33歲女友官宣戀情，后者為健身網紅

24歲科隆中場克勞斯與33歲女友官宣戀情，后者為健身網紅

科學發掘

2026-04-03 18:38:33

伊朗稱擊中敵軍先進戰機

財聯社

2026-04-03 03:56:29

黃金市場重量級觀點！買入警報：美國頂級經濟學家稱黃金走勢即將反轉

黃金市場重量級觀點！買入警報：美國頂級經濟學家稱黃金走勢即將反轉

新浪財經

2026-04-03 10:42:05

一字跌停，直接退市，今天最后一個交易日，股價定格在0.58！

一字跌停，直接退市，今天最后一個交易日，股價定格在0.58！

丁丁鯉史紀

2026-04-03 10:58:18

王毅外長給這場戰爭定了性，中國不可能給美國買單

王毅外長給這場戰爭定了性，中國不可能給美國買單

蘭妮搞笑分享

2026-04-03 20:03:35

1998年數萬華人遭屠殺，中國為何沒出兵？26年后答案讓人沉默

1998年數萬華人遭屠殺，中國為何沒出兵？26年后答案讓人沉默

哄動一時啊

2026-02-17 22:21:25

33億！字節跳動在北京拿下第二宗地

33億！字節跳動在北京拿下第二宗地

選址中國

2026-04-03 18:30:25

十四屆全國政協教科衛體委員會原副主任楊小偉，受賄數額特別巨大

十四屆全國政協教科衛體委員會原副主任楊小偉，受賄數額特別巨大

大風新聞

2026-04-02 12:07:04

“已淪陷”“堵成停車場”！深圳到處人從眾！有人稱3小時挪了不到5公里

“已淪陷”“堵成停車場”！深圳到處人從眾！有人稱3小時挪了不到5公里

南方都市報

2026-04-03 22:11:21

172.3米！奇安信華南總部大廈竣工，坐標廣州！

172.3米！奇安信華南總部大廈竣工，坐標廣州！

GA環球建筑

2026-04-03 21:33:50

不甜不咸不油，卻偷偷傷害全身！很多人每天都在超量吃

不甜不咸不油，卻偷偷傷害全身！很多人每天都在超量吃

蝌蚪五線譜

2026-04-03 17:03:28

云南30歲女子賣淫：一天接客多達十幾人，每次時長不限價格僅百元

云南30歲女子賣淫：一天接客多達十幾人，每次時長不限價格僅百元

老貓觀點

2026-04-03 08:13:49

他是著名演員，從發病到去世僅20分鐘，主持人兒子比他更有名

他是著名演員，從發病到去世僅20分鐘，主持人兒子比他更有名

削桐作琴

2026-03-21 15:03:45

AI產業主平臺領航智能+時代

14885文章數 66745關注度

往期回顧全部

科技要聞

5萬輛庫存車，給了特斯拉一記重拳

頭條要聞

伊朗：美飛行員跳傘在伊境內落地美方曾試圖營救未果

頭條要聞

伊朗：美飛行員跳傘在伊境內落地美方曾試圖營救未果

體育要聞

被NBA選中20年后，他重新回到籃球場

娛樂要聞

夏克立官宣再婚當爸？否認婚內出軌

財經要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

房產

時尚

游戲

本地

數碼要聞

消息稱三星顯示器部門面臨巨大危機，最壞結果將退出中國大陸市場

房產要聞

小陽春全面啟動！現房，才是這波行情里最穩的上車票

春天外套完全沒必要買太多，長風衣要準備好，簡單百搭又高級

別人漲它降價！Xbox掌機逆勢開賣推出超值促銷

本地新聞

跟著歌聲游安徽，聽古村回響

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sup id="0a0aa"><cite id="0a0aa"></cite></sup>

<blockquote id="0a0aa"><strong id="0a0aa"></strong></blockquote>

<tfoot id="0a0aa"><dd id="0a0aa"></dd></tfoot>