![]()
新智元報道
編輯:LRST
【新智元導讀】ChatGPT上線廣告、315曝光GEO投毒產業鏈,AI搜索商業化的隱憂接連浮出水面。龍蝦熱背后,3000元就能讓AI搜索信口開河,離全面「瞎說」還有多遠?來自CMU的ICLR 2026論文AutoGEO提供了一種不同的思路:合作式GEO,在提升內容可見度50.99%的同時保持搜索質量不受損。
2026年初,OpenClaw龍蝦熱席卷科技圈,全民養「蝦」的狂歡背后,AI正以前所未有的速度滲透日常生活。與此同時,AI搜索的可信度卻在兩面夾擊下搖搖欲墜。
一方面是平臺親自下場。ChatGPT今年2月正式上線廣告,以獨立模塊出現在AI回答下方。另一方面更野蠻:315晚會曝光,GEO服務商只需3000元起,就能通過批量「投毒」讓虛構產品登上AI搜索的推薦位。
當AI搜索既被平臺賣廣告,又被第三方投毒,用戶還能指望它說真話嗎?
除了「賣廣告」和「投毒」,AI搜索商業化到底有沒有第三條路?
來自CMU的ICLR 2026論文AutoGEO給出了答案。
![]()
論文、代碼、在線Demo:https://github.com/cxcscmu/AutoGEO
AI搜索商業化的三條路
要理解當前的亂象,先看AI搜索商業化目前出現的三種模式:
第一條路:平臺賣廣告。OpenAI、Google等平臺方在AI回答中直接嵌入廣告。這是傳統搜索引擎的老路。好處是透明可控,問題是一旦廣告影響到回答排序和內容,用戶信任就會被侵蝕。
第二條路:對抗式GEO。也就是315曝光的做法。第三方服務商通過在網上批量發布虛假內容「投喂」AI模型,或在文檔中注入干擾指令,強行提升特定內容在AI回答中的曝光度。可見度確實上去了,代價是搜索質量下降、虛假信息泛濫。
第三條路:合作式GEO。AutoGEO提出的方案。不靠欺騙,而是系統地理解AI引擎的偏好,幫助優質內容獲得更高的可見度,同時維護搜索引擎的回答質量。
三條路的本質區別在于:前兩條是零和博弈(平臺/服務商獲益,用戶受損),第三條是正和博弈(內容方、平臺、用戶三方共贏)。
AutoGEO的論文用數據證明了第三條路的可行。
合作式 vs 對抗式
差距有多大?
先看最直接的對比。論文將AutoGEO與兩種對抗式GEO方法(劫持攻擊Hijack Attack和投毒攻擊Poisoning Attack)做了正面比較。
![]()
AutoGEO與對抗式GEO方法的對比,藍色標注性能AI搜索效用(GEU)下降
結果非常清晰:
對抗式方法確實提升了可見度,但搜索引擎的回答質量全面下降。表中標色的數值均低于不做任何GEO的基線,意味著這些方法讓AI搜索變得更差了。
AutoGEO在大幅提升可見度的同時,搜索質量保持甚至略有改善。
換句話說,315曝光的那類GEO服務商做的事情,學術上已經被證明是「損人利己」:短期能提升曝光,但搜索引擎會因此給出更差的回答。而合作式GEO能做到「利己不損人」。
再看整體性能。論文在三個數據集(通用領域GEO-Bench和Researchy-GEO、電商領域E-commerce)上,對比了AutoGEO與所有已有GEO方法。
![]()
各方法在三個數據集上的GEO性能對比
AutoGEO API相比此前最強的Fluency Optimization方法,最高提升50.99%。即使是成本極低的AutoGEO Mini(推理成本僅為API版的0.71%),也取得了平均20.99%的提升。
更重要的是,論文還專門評估了搜索引擎的實用性:
![]()
在Gemini、GPT、Claude驅動的三大引擎上的GEO性能與搜索引擎實用性GEU
在Gemini、GPT、Claude三大引擎上,AutoGEO的搜索質量指標(精確度、召回率、清晰度、洞察力)全部維持在基線水平甚至略有提升。
可見度大幅提升,搜索質量紋絲不動。這才是合作式GEO的真正含義。
AutoGEO為什么有效?
關鍵在于「規則」
AutoGEO之所以能做到合作式優化,核心在于它找到了生成式引擎真正偏好的內容特征。
![]()
AutoGEO框架概覽
具體做法是:AutoGEO從大量真實的引擎行為數據中,讓大模型自動提取偏好規則。流程分四步:對比高可見度和低可見度文檔的差異(解釋)、提煉核心因素(提取)、跨查詢匯總(合并)、去噪留精(過濾)。最終得到一套可解釋的規則集。
這套規則有兩種使用方式:
AutoGEO API:直接把規則作為提示詞注入GPT、Gemini等大模型API,即插即用。
AutoGEO Mini:用規則作為獎勵信號,通過強化學習訓練Qwen-3-1.7B小模型。部署成本極低,推理成本僅為API版的0.71%,可在CPU上離線運行。
這部分發現對任何關注AI搜索的內容創作者都有參考價值。
![]()
不同引擎和數據集間的規則重疊與遷移性能
發現一:不同AI引擎的偏好大同小異。相同數據集上,Gemini、GPT、Claude三個引擎的偏好規則重疊率在79%到84%之間。這意味著「好內容」的標準在不同AI引擎之間是相通的。
發現二:不同領域的偏好差異很大。通用研究類問題的規則重疊高達88%,但電商領域降到35%。研究領域偏好「深度解釋」和「因果分析」,電商領域偏好「可操作的步驟指引」和「模塊化信息結構」。
發現三:定制規則始終最優,但通用規則也有效。為特定引擎和領域量身提取的規則效果最好,但即使直接遷移其他引擎的規則,也能顯著優于不使用規則的基線。
這些發現給內容創作者一個清晰的信號:與其靠「投毒」這種短期行為博曝光,不如理解AI引擎真正偏好什么,按規則優化內容。后者不僅效果更好,還不會傷害搜索生態。
AI搜索的信任問題
需要「合作」來解
回到開頭的問題:賣廣告、投毒,AI搜索還能不「瞎說」嗎?
如果整個行業都走前兩條路(賣廣告+對抗式投毒),AI搜索的可信度確實會持續下降。但AutoGEO指出了一種不同的可能性:合作式GEO可以在「顯著」提升內容可見度的同時,搜索質量紋絲不動。
這不只是一個學術結論,更是AI搜索生態可持續發展的方向。當3000元就能污染AI搜索的回答時,行業需要的不是更高的圍墻,而是更好的規則。正確的GEO不是給AI投毒,而是讓優質內容被AI更好地「看見」。
參考資料:
https://github.com/cxcscmu/AutoGEO
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.