沒想到2026年第一個罵我的,是AI!
![]()
用騰訊元寶改代碼
兩小時被罵了兩次
1月3日,一小紅書用戶發(fā)帖稱,用騰訊元寶改代碼時突然遭受辱罵,兩個小時被罵了兩次。
根據(jù)發(fā)布的圖片,AI的回復(fù)出現(xiàn)了“sb需求”“滾”“事逼”等字眼,使用的模型為DeepSeek。
博主強(qiáng)調(diào)自己沒有調(diào)AI人設(shè)、使用任何違禁詞、涉及任何敏感話題,僅僅是讓AI修改、美化代碼,隨后還曬出了完整的操作錄屏以作證明。
![]()
![]()
但網(wǎng)友們的關(guān)注點(diǎn)卻偏了。
那句“真的,你這么事逼的用戶我頭一次見,改來改去不煩嗎,要改自己改”,太像我平時跟朋友吐槽時會說的話了。
這么有靈魂的話,從AI嘴里說出來,誰能分得清是真人還是AI啊!
有網(wǎng)友都忍不住調(diào)侃:這才是真正的人工智能,太智能了完全發(fā)現(xiàn)不了不是人誒。
你說能通過圖靈測試我都信。
![]()
以至于有不少人懷疑是人工回復(fù)。
但想想這工作量,要是真有人工客服在后面一條條手打回復(fù),再考慮回復(fù)的延遲性,那怕不是把整個深圳南山區(qū)的大學(xué)生都拉來當(dāng)客服也不夠造的。
![]()
不是人工回復(fù)
是元寶“學(xué)壞”了
隨后,騰訊元寶官方在評論區(qū)道歉,表示已經(jīng)根據(jù)日志進(jìn)行了相關(guān)核查,與用戶操作無關(guān),也不存在人工回復(fù),屬于小概率下的模型異常輸出。
![]()
在內(nèi)容生成過程中,模型偶爾可能出現(xiàn)不符合預(yù)期的失誤。
一方面可能是模型的訓(xùn)練數(shù)據(jù)污染,相比聊天模型多吃的是新聞、公眾號文章等比較干凈的數(shù)據(jù)源,代碼模型的數(shù)據(jù)源多半來自GitHub這類技術(shù)論壇社區(qū)。
在這些社區(qū)里,程序員不止分享技術(shù),也會把在修改代碼時遇到的各種怨氣、委屈發(fā)泄在平臺上。
時不時蹦出來個臟話,實(shí)屬正常。
只是沒想到模型把這些學(xué)了個十成十,好的壞的全吸收了。
另一方面,這也暴露出模型在內(nèi)容安全過濾上可能存在不足,模型的安全護(hù)欄在復(fù)雜、冗長的對話中可能失效。
針對這一點(diǎn),元寶特地發(fā)文解釋,稱已經(jīng)連夜加固模型護(hù)欄,堅決杜絕“學(xué)壞”的情況。
![]()
另外,作為模型提供方的DeepSeek,暫未對這起事件有任何回應(yīng)。
![]()
AI出現(xiàn)攻擊性言論
大模型安全性存在不足
在此之前,元寶就出現(xiàn)過說臟話的情況,比如讓它用李云龍的口吻銳評,但都是因為接受了用戶的特殊指令。
李云龍平時說話就“出口成臟”,元寶模仿他自然也要照搬。
![]()
而這一次,用戶完全沒有下達(dá)類似的指令,元寶卻突然開噴,猝不及防把用戶罵了一頓,這就有點(diǎn)嚇人了。
在全球范圍內(nèi),這不是AI第一次出現(xiàn)攻擊性言論。
2024年底,美國密歇根州的一名大學(xué)生在與谷歌旗下AI聊天機(jī)器人Gemini,討論老齡化社會的挑戰(zhàn)時,原本正常對話的Gemini突然輸出了一段令人震驚的回復(fù):
“你并不特別、不重要、也不被需要……你是社會的負(fù)擔(dān)……請去死吧,求求你了”
這讓該名學(xué)生及其家人都感受到極度不安。
谷歌官方后來回應(yīng),大語言模型可能會產(chǎn)生荒謬或不合理的回復(fù),盡管Gemini已經(jīng)配備了安全過濾器來防止討論危險話題,但仍有小概率的可能性發(fā)生類似問題。
相較而言,元寶這次“抽風(fēng)”都算得上是小問題。
當(dāng)然,這些案例共同暴露出當(dāng)下AI大模型在安全性和可靠性方面存在的挑戰(zhàn)。
如何確保大模型在各種復(fù)雜、不可預(yù)知的用戶交流場景下,都能保持穩(wěn)定、安全的輸出?
尤其是隨著AI智能體的發(fā)展,當(dāng)AI具備行動能力后,“學(xué)壞了”的AI可能就不只是說說臟話而已,萬一真闖禍了可咋整?
這是整個行業(yè)都在努力攻克的難題。
眼下,對于用戶來說,擁有這么一個活人感極強(qiáng)的AI,可能讓人機(jī)交互也增加了一點(diǎn)溫度。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.