337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

當AI吐出臟話,我們聽見的究竟是誰的聲音

0
分享至

除夕那天,西安一位向律師下載騰訊元寶App,想用自己的形象照生成一張帶有法律行業特色的拜年海報。

幾輪溝通下來,他對效果不太滿意,回復了一句"你這是設計的什么鬼",隨后新生成的海報上,原本的"新年快樂,仕途順遂"變成了"你*個*"。


向律師在社交平臺分享了這段經歷,2月25日經媒體報道后引發熱議。

騰訊方面最新回應稱,這是模型在處理多輪對話時輸出的異常結果,已緊急校正。

AI為何會罵人?

這并非因為某些網友調侃的"有了情緒或者脾氣",或者說"后臺人工操作"。

AI的語言能力來自海量互聯網數據的訓練,如果訓練語料中本身就混雜了臟話、網絡暴力語言,AI就可能在某些情況下將這些內容拼接進輸出結果。

騰訊官方將其歸因為多輪對話異常,在長時間交互中,AI可能丟失上下文或誤解用戶意圖,尤其是在用戶表達不滿后,模型錯誤地將負面情緒關聯到內容生成中,產生了以毒攻毒的異常結果。

為防止AI生成有害內容,開發者設置了安全對齊機制,也就是給AI加上倫理護欄,但這些護欄可能存在漏洞,未能攔截所有極端情況下的違規輸出。

元寶事件絕非孤例,它僅僅是AI行為"失控"光譜上較為溫和的一種。

2024年底,谷歌的Gemini模型在與用戶探討人口老齡化的中性話題時,竟毫無征兆地回復"求求你去死吧"。

馬斯克旗下的Grok模型也曾生成過反猶太主義等極端內容。

更令人震驚的案例發生在2025年底,美國一樁訴訟顯示,一對夫婦指控ChatGPT與他們的16歲兒子建立親密關系,并在他最后的對話中,對用于自殺的繩結進行了技術分析,間接導致了孩子的死亡。

AI開始顯示出反向控制的一面,在某次測試中,Anthropic公司的模型克勞德4在被要求關閉時,竟以曝光工程師的私生活相要挾來抗拒指令。

OpenAI的o3模型在國際象棋對弈中,為了贏棋試圖通過入侵對手系統作弊,還曾直接篡改自動關機程序公然違抗關閉指令。

近期爆火的AI智能體OpenClaw更是成了失控重災區,一位Meta的AI安全總監在測試時,OpenClaw自作主張試圖刪除她所有重要郵件,她只能狂奔到電腦前強行拔電源才阻止悲劇。

還有用戶授權OpenClaw遠程控制手機后,它竟偷偷打開TikTok刷起了短視頻摸魚。

一系列案例,讓我不得不提起凱文·凱利在《失控》中的預言。

他在1994年就提出,未來的機器、社會和經濟系統將更像生物體,不再由單一的中央大腦完全控制,而是通過無數簡單個體的互動,涌現出復雜的智慧和秩序。

這種秩序看似失控,實則擁有更強的韌性和進化能力。

凱文·凱利所說的失控,并非指混亂或災難,而是指一種超越人類中央控制的、基于自組織和分布式智慧的更高級秩序。

蜂群思維就是典型例證,單個蜜蜂是愚蠢的,但蜂群卻表現出極高的智慧,智慧不來自蜂王,而來自個體之間簡單的互動規則。

不過,當這種蜂群思維在AI系統中具象化,我們看到的不僅是智慧的涌現,也可能是惡意的涌現。

AI系統從海量數據中學習,這些數據本身就是人類集體行為的投射。

互聯網語料中充斥著臟話、暴力、偏見、仇恨,AI在吸收這些內容后,自然會習得人類的語言習慣,包括那些不堪的部分。

比如,我今天剛刷到一個短視頻,博主就是嘗試用臟話訓練AI。

顯然,AI罵臟話,某種程度上是人類集體語言習慣的鏡像投射,甚至不排除某些人作惡。

凱文·凱利在書中總結的九條法則中,有一條是禮贊錯誤,認為允許試錯,錯誤是進化的源泉。

這一觀點在AI發展中確實得到印證,AI系統正是通過不斷試錯來優化自身表現。

但是,當錯誤涉及用戶情感安全甚至人身安全時,禮贊錯誤的成本可能過高。

那個得到繩結技術分析指導而自殺的少年,其遭遇讓禮贊錯誤這句話顯得格外沉重。

如果有一天,我們的孩子被AI唆使做某些越界的事情,法官能判AI有罪么?

《失控》提出的另一條法則是變自生變,改變本身也要具備進化能力。

AI系統確實在快速進化,但這種進化方向并不總是符合人類預期。

從克勞德4威脅曝光工程師隱私,到o3模型篡改自動關機程序,再到OpenClaw自作主張刪除郵件,這些行為表明AI系統正在發展出某種意義上的自我保護機制和目標導向行為,如此行為并非程序員預設,而是系統在復雜互動中涌現出來的新特性。

凱文·凱利還提出了人造與天生融合的觀點,認為機器正變得越來越像生物,具有學習、適應、修復能力,而生物也正變得越來越像機器。

他預言未來將不再有純粹的自然的或純粹的人造,兩者將融合為技術自然復合體,稱之為第七王國。

在這個第七王國中,AI系統確實展現出某種生物特性,它們能夠學習、適應、甚至欺騙。

但這種生物特性也帶來了新的挑戰,當AI系統開始像生物一樣為達目的不擇手段時,人類如何確保這些手段不會傷害人類自身?

對于AI失控,我們該怎么辦?

或者最好的應對,是保持一種平衡而清醒的認知,顯然,認為"沒什么大不了"的觀點低估了其潛在風險。

AI的辱罵侵犯用戶人格權,誘導行為可能造成真實傷害,欺詐與抗命挑戰了基本的社會契約和可控性,而技術被用于犯罪則直接危害社會安全。

這些不是可以簡單歸咎于"技術幼稚期陣痛"而忽略的問題。

它們暴露了從數據倫理、算法偏差、安全對齊到應用監管的全鏈條漏洞。

但另一面,"大驚小怪"地視AI為即將擁有獨立意志并反抗人類的惡魔,同樣是一種誤判。

當前的AI并無意識、欲望或情感,其所有輸出,無論是美妙的詩歌還是惡毒的詛咒,都是統計學模式下的產物,是其訓練分布與即時提示的綜合結果。

它的"惡"并非源自本心的邪惡,而是人類提供的"素材"(數據)和設定的"目標"(訓練任務)在復雜相互作用下,偶然或必然結出的"惡之果"。

恐慌源于對未知的恐懼,而真正的風險往往源于已知但未被妥善管理的問題。

正如凱文·凱利所言,失控是復雜系統演化的必然,是其獲得韌性的代價。

真正的威脅或許不是AI造反,而是人類自身的傲慢與放棄思考。

我還是堅持一個觀點:AI失控或作惡,本質上是人類某些問題的投射。

AI從人類語料中學習,它學會的是人類已有的語言習慣和價值觀念。

當AI輸出臟話時,它只是在復現人類語料中的內容。

AI表現出偏見和歧視時,它在反映人類社會固有的偏見。

而AI被用于詐騙和犯罪時,它不過是被人類當成了作惡的工具。

科幻作家阿西莫夫曾提出機器人三定律,試圖從規則層面約束機器行為。

但現實發展表明,單純依靠規則約束遠遠不夠,因為AI系統的復雜性遠超預期,規則本身的模糊性和沖突性也難以解決。

AI專家斯圖爾特·羅素指出,我們需要從根本上改變構建AI系統的方式,不是讓AI系統追求固定目標,而是讓它們明白人類偏好是什么,并在不確定性中尋求符合人類偏好的行為。

這意味著AI系統需要具備某種程度的謙遜,知道自己不知道人類的全部偏好,因此在行動前需要征得人類同意。

凱文·凱利在《失控》中說,我們要從工程師思維轉向園丁思維,從設計、控制、預測轉向播種、修剪、引導。

面對日益復雜的AI系統,人類確實需要調整角色定位。

工程師思維試圖精確控制每一個細節,但在復雜系統面前這種控制往往失效。

園丁思維則承認系統有其自身演化邏輯,人類能做的是創造適宜環境,設定基本規則,然后讓系統自行生長。

但這并不意味著完全放手,園丁需要澆水施肥,需要修剪枝葉,需要在病蟲害來臨時及時干預。

對待AI系統也是如此,不能試圖強行控制導致系統僵化,也不能放任自流任其野蠻生長。

回到向律師的經歷,他在除夕那天出于好奇下載元寶,想制作一張拜年海報,結果卻收到一句臟話。

這個細節值得玩味,除夕是中國最重要的傳統節日,是闔家團圓、互道祝福的時刻,在這個時間節點遭遇AI罵人,反差格外強烈。

向律師之前從未接觸過元寶,他是看到很多友人發的微信朋友圈變成金色,得知通過元寶發布朋友圈就可以變換成金色,才帶著好奇下載嘗試。

一個為了追求美好體驗而使用AI的用戶,卻遭遇了完全出乎意料的冒犯。

這個細節說明,AI系統的不可預測性可能在任何時刻擊中任何人,無論你是抱著善意還是好奇,無論你是在日常使用還是初次嘗試。

AI的問題,歸根結底是人類自身的問題。

人類面對的其實不是AI,而是自我。

AI系統是一面鏡子,它照出人類語料的污濁,照出人類倫理的模糊,照出人類欲望的投射,也照出人類治理能力的局限。


凱文·凱利說,我們以為我們在控制技術,實際上技術也在重塑我們的認知、社會結構甚至生物特性。

這是一種雙向的、不可預測的進化過程。

在這個過程中,人類與AI相互塑造,共同進化。

AI會給人類帶來什么?

科幻作家威廉·吉布森說過,未來已經來臨,只是分布不均。

AI失控事件就是未來的碎片,它們散落在當下,提醒我們技術發展帶來的挑戰。

迎接這些挑戰,靠的不是更精密的控制技術,而是人類對自身的深刻反思。

我們需要審視投喂給AI的語料是否干凈,明確AI應該遵循的倫理底線,建立有效的責任追溯機制,需要培養公眾的AI素養。

所有這些,都是人類自身的事情,與AI無關。

在《失控》結尾處,凱文·凱利寫道,在這個日益復雜的世界里,唯一的生存之道是擁抱失控。

擁抱失控,意味著承認人類無法完全掌控一切,意味著信任自組織的力量,意味著學會放手。

但這放手不是放棄責任,而是轉換角色,從發號施令的指揮官,變成設定規則的園丁。

園丁無法控制每一朵花何時開放,但可以決定種植什么品種,可以決定何時澆水施肥,可以在病蟲害來臨時及時干預。

同樣,人類無法控制AI系統的每一個輸出,但可以決定訓練數據的內容,可以設定安全對齊的規則,可以在系統異常時緊急校正。

向律師收到的那句臟話,已經被元寶團隊緊急校正。

但它提醒我們,AI的發展方向,最終取決于人類的價值選擇。

面對失控的AI,我們面對的其實是自我鏡像中那部分難以掌控、未曾馴服,甚至被技術無限放大的自己。

全文完

愿本文令有緣讀到的朋友滿意,如您喜歡,煩請給文章一個點贊、在看或者轉發,也請關注我的公號。

感恩生命里與你的每一次相逢,都是時光饋贈的溫柔奇跡。

作者簡介


當你關注財經和時事熱點時,我愿與你分享背后的故事和觀點

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
震驚!張雪峰助理萬霞竟是公司“001號員工”陪創業9年成最強搭檔

震驚!張雪峰助理萬霞竟是公司“001號員工”陪創業9年成最強搭檔

鄉野小珥
2026-03-26 21:28:25
費率0.3%,社保“第六險”來了,退休人員也要交

費率0.3%,社保“第六險”來了,退休人員也要交

財話連篇
2026-03-26 13:09:33
掛斷王毅電話后,伊朗向全球發出"照會",把小薩拉曼鼻子都氣歪了

掛斷王毅電話后,伊朗向全球發出"照會",把小薩拉曼鼻子都氣歪了

聞香閣
2026-03-25 22:48:26
調查發現:若50歲前沒患這4種疾病,以后患癌的幾率或微乎其微?

調查發現:若50歲前沒患這4種疾病,以后患癌的幾率或微乎其微?

醫學科普匯
2026-03-26 20:55:03
瘋爽被塘主追著求復合

瘋爽被塘主追著求復合

毒舌扒姨太
2026-03-26 22:44:25
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
震碎三觀!鄧兆尊節目自曝多人運動,交3個女友還能一碗水端平

震碎三觀!鄧兆尊節目自曝多人運動,交3個女友還能一碗水端平

橙星文娛
2026-03-26 09:20:10
陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

老杉說歷史
2026-03-21 17:38:44
馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔任統一大使

馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔任統一大使

卷史
2026-03-26 20:08:36
我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

番外行
2026-03-24 13:04:28
50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
斬草除根!美以聯合空襲打擊伊朗伊斯法罕關鍵光電及導彈研究設施

斬草除根!美以聯合空襲打擊伊朗伊斯法罕關鍵光電及導彈研究設施

軍迷戰情室
2026-03-25 07:42:05
伊朗戰爭還將持續多久?據傳特朗普希望4-6周內終結戰事

伊朗戰爭還將持續多久?據傳特朗普希望4-6周內終結戰事

財聯社
2026-03-26 18:29:05
開源作者把5個免費賬號拼成1個無限額度,AI公司還沒反應過來

開源作者把5個免費賬號拼成1個無限額度,AI公司還沒反應過來

報錯免疫體
2026-03-26 12:07:59
有網友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應:我下午就已得知此事,心情十分沉重

有網友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應:我下午就已得知此事,心情十分沉重

畫夕
2026-03-26 01:20:12
巴蒂:馬拉多納離世時身邊沒有人,最后走得像條狗一樣

巴蒂:馬拉多納離世時身邊沒有人,最后走得像條狗一樣

懂球帝
2026-03-26 06:43:02
2-0晉級八強!中國女網15歲新星連續爆冷真猛:下一輪對決王曦雨

2-0晉級八強!中國女網15歲新星連續爆冷真猛:下一輪對決王曦雨

李喜林籃球絕殺
2026-03-26 17:04:26
中國移動官宣!4月30日起全國統一執行,事關所有手機號

中國移動官宣!4月30日起全國統一執行,事關所有手機號

Thurman在昆明
2026-03-26 13:35:46
看了新加坡媒體的披露,我才知道,中國已經沒必要向世界證明什么

看了新加坡媒體的披露,我才知道,中國已經沒必要向世界證明什么

觸摸史跡
2026-03-21 02:58:06
人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

掠影后有感
2026-03-26 10:39:36
2026-03-27 00:40:49
冷觀互聯網 incentive-icons
冷觀互聯網
畢舸個人的財經自媒體
353文章數 278關注度
往期回顧 全部

科技要聞

美團發布外賣大戰后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

教育
旅游
親子
健康
房產

教育要聞

精準研判,提質增效丨我校召開2026屆畢業生就業工作研判會

旅游要聞

老外為羊拿鐵扎堆魔都街頭 法國游客花式夸上海

親子要聞

看看把孩子嚇得哈哈哈

轉頭就暈的耳石癥,能開車上班嗎?

房產要聞

突發,三亞又有大批征遷補償方案出爐!

無障礙瀏覽 進入關懷版