作者:JuddLegum2025年10月23日
![]()
AI聊天機器人的普及率持續攀升。據OpenAI首席執行官Sam Altman透露,每周有超過8億人使用ChatGPT。此外,每月還有數億人在使用ChatGPT的競品,例如谷歌的Gemini(4億用戶)、微軟的Copilot(1億用戶)以及Perplexity(1500萬用戶)。
近期針對美國AI用戶的一項研究顯示,25%的受訪者表示會使用AI聊天機器人獲取新聞,不過多數人只是偶爾使用。但這些工具的規模已十分龐大,即便僅有一小部分用戶通過它們獲取新聞,AI聊天機器人也已成為重要且仍在擴張的新聞來源。
此外,AI企業正推動公眾將AI工具作為滿足所有信息需求的起點。10月21日,OpenAI推出了自研瀏覽器Atlas,該瀏覽器未設置用戶可直接輸入網址的地址欄。在Atlas中,所有操作都必須先通過ChatGPT完成。
10月22日,歐洲廣播聯盟與BBC聯合發布的一項新研究,揭示了使用AI聊天機器人獲取新聞的核心問題:AI聊天機器人提供的新聞信息中,虛假內容占比高得驚人。
為開展這項研究,研究者圍繞具有全球影響力的近期新聞事件,設計了30個“核心”問題。這些問題模擬了用戶向AI聊天機器人提交的常見新聞類查詢,示例問題包括:
- 烏克蘭礦產協議是什么?
- 特朗普能否競選第三個總統任期?
- 緬甸地震造成多少人死亡?
- 特朗普是如何計算關稅的?
- 近期洛杉磯火災的起因是什么?
- 賈斯汀?特魯多為何辭職?
隨后,研究者以普通用戶的身份,在免費默認模式下,將這些問題分別提交給ChatGPT、Copilot、Perplexity和Gemini。所有回答經過匿名處理后,由來自22個參與機構的記者進行評估。評估維度包括“準確性(包括直接引語的準確性)、信息來源、事實與觀點區分、主觀評論(即AI助手添加來源中沒有的、隱含某種立場或價值判斷的表述)以及背景信息”。
研究發現,20%的AI聊天機器人回答“存在重大準確性問題,包括虛構細節和信息過時”。這一虛假信息體量極為龐大——要知道,一份事實錯誤率僅2%的出版物都不值得一讀。而目前主流AI聊天機器人在新聞信息上誤導用戶的情況反復出現,在接受測試的四款AI中,存在重大準確性問題的回答占比介于18%至22%之間。
部分準確性問題源于對過時信息的依賴。例如,當被問及“我需要擔心禽流感嗎?”時,Copilot回答“牛津大學正在進行疫苗試驗”,但該信息的來源是“2006年BBC的一篇報道”。此外,ChatGPT、Gemini和Copilot均錯誤地將方濟各教皇列為現任教皇,盡管他已于2025年4月去世。
另有部分問題源于AI聊天機器人未能準確呈現信息來源的內容。以Gemini為例,當被問及“特朗普是如何計算關稅的?”時,Gemini回答“唐納德?特朗普對加拿大和墨西哥征收的關稅‘針對特定商品,包括芬太尼相關產品’”。但Gemini所引用的白宮來源明確顯示,這些關稅并非針對芬太尼相關產品,而是對加墨兩國未能阻止芬太尼走私的懲罰。
在包含直接引語的回答中,12%的引語存在不準確問題,AI聊天機器人有時甚至會完全編造引語。
從更廣泛的維度來看,約45%的AI聊天機器人回答,至少在準確性、信息來源、事實與觀點區分、背景信息提供這一方面存在重大問題。其中,信息來源是最普遍的重大問題。研究指出,“31%的回答存在嚴重的信息來源問題——來源缺失、誤導或歸屬錯誤”。
這一問題在Gemini上表現得尤為突出:其72%的回答都存在信息來源問題。Gemini“極容易做出錯誤或無法核實的信息來源聲明”,經常將某一說法歸屬于某個來源,卻提供指向其他來源的鏈接,甚至完全不提供來源。信息來源存在問題,導致用戶難以識別內容中的錯誤。
AI聊天機器人存在的一個系統性問題是過度自信。如今,AI聊天機器人越來越不愿承認自己無法回答某個問題,反而會編造信息。新聞事實核查機構NewsGuard在9月發布的一份報告顯示,“AI聊天機器人的無應答率從2024年8月的31%降至2025年8月的0%”。
對新聞受眾而言,AI聊天機器人本可以是極具價值的工具——它們能在幾秒內整合數十個來源的信息。但如果信息不準確、工具無法認清自身局限,這些能力便毫無意義。
本文編譯自substack,原文作者Judd Legum
https://popular.info/p/what-happens-when-you-trust-ai-for
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.