337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌最新研究:重復提示詞可將AI準確率從21.33%提升至97.33%

0
分享至


最近小編發現了一個效果出奇好的提示詞技巧,實測結果堪稱驚人。

谷歌一篇新論文《重復提示詞提升非推理型大語言模型性能》指出,在部分任務中,簡單重復提示詞就能將非推理型大語言模型的準確率從21.33%提升至97.33%。


乍聽之下,這說法簡直玄乎,讓人難以相信。但背后的原理其實無比簡單。

谷歌在70項不同的基準測試任務中開展了實驗,這種復制粘貼式的提示詞重復法:

? 在47項任務中表現優于基準模型

? 全程無一失手

? 帶來了肉眼可見的大幅性能提升,部分任務的準確率從約21%飆升至約97%



這個測試,覆蓋了 7 個主流模型:Gemini 2.0 Flash / Flash Lite、GPT-4o / GPT-4o-mini、Claude 3 Haiku / Claude 3.7 Sonnet、DeepSeek V3 等。

測試基準包括 ARC (Challenge)、OpenBookQA、GSM8K、MMLU-Pro、MATH,及自定義任務NameIndex、MiddleMatch。


對于選擇題任務,測試兩種順序,問題在前(Question-First)與選項在前(Options-First)。

那么,重復問題為何能起到這樣的效果?

論文給出了一個極具工程視角的解釋:大語言模型均以因果語言模型為基礎進行訓練,它們逐詞生成文本,嚴格遵循從左到右的順序,每個詞元只能“看到”其之前的內容。

當你重復問題時(比如將問題Q改寫為Q1+Q2),第二個副本中的每個詞元都能完整關聯第一個副本的全部信息。

實際上,這相當于在不改動模型、不增加推理步驟的前提下,讓模型獲得了回顧并重新梳理信息的機會。

類似的小技巧還有其他,比如清華大學此前發現的“先驗證”策略。

在其論文《Asking LLMs to Verify First is Almost Free Lunch》中,清華大學團隊提出了一個反直覺的思路:與其讓AI直接回答,不如先讓它"找茬"。

這個名為先驗證(Verification-First, VF)的策略簡單到令人難以置信:

傳統方式(Chain-of-Thought):


Q: 球棒和球問題...

A: 讓我一步步思考...

VF方式:


Q: 球棒和球問題...(提示:答案可能是"0.10元",先驗證它對不對,再給出正確答案)

A: 先驗證"0.10元"是否正確...

關鍵點:即使提供的答案是隨機的、錯誤的,甚至"1"這樣毫無意義的數字,VF依然有效!

結果是,這個"笨辦法"能讓AI推理準確率提升10-15%,而且幾乎不增加計算成本。

可見,讓人工智能變得“更聰明”,未必需要增加復雜度,只需優化提示詞的結構就夠了。

谷歌論文地址:https://arxiv.org/pdf/2512.14982


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
尚界Z7/Z7T預售5天市場簡報:華為手機用戶占比50%

尚界Z7/Z7T預售5天市場簡報:華為手機用戶占比50%

CNMO科技
2026-03-29 22:22:05
烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

我心縱橫天地間
2026-01-22 18:41:25
俄烏戰場傳來血的教訓,我們最先進的殲20,不能再抱著火箭彈不放

俄烏戰場傳來血的教訓,我們最先進的殲20,不能再抱著火箭彈不放

安安說
2026-03-28 11:54:14
美軍7億美元預警機被伊朗擊毀 慘烈現場曝光

美軍7億美元預警機被伊朗擊毀 慘烈現場曝光

看看新聞Knews
2026-03-29 18:51:08
記者:熱刺愿向德澤爾比提供豐厚保級獎金,但目前仍被拒絕

記者:熱刺愿向德澤爾比提供豐厚保級獎金,但目前仍被拒絕

懂球帝
2026-03-30 07:00:09
比亞迪大唐終于來了,不是傳說,是真要賣了!

比亞迪大唐終于來了,不是傳說,是真要賣了!

劉哥談體育
2026-03-30 00:09:14
沈南談張雪峰葬禮:最初大家都克制小聲哭,張母大哭全場都放聲哭

沈南談張雪峰葬禮:最初大家都克制小聲哭,張母大哭全場都放聲哭

喜歡歷史的阿繁
2026-03-29 18:56:46
13.9mm塞進10000mAh,綠聯把充電寶做成了信用卡

13.9mm塞進10000mAh,綠聯把充電寶做成了信用卡

碳基打工人
2026-03-28 14:15:11
與潘江雪藏蓋伊無關!山西男籃末節崩盤負于上海隊的客觀事實在這

與潘江雪藏蓋伊無關!山西男籃末節崩盤負于上海隊的客觀事實在這

老壥說體育
2026-03-30 07:29:30
2020年女子當眾扇兒子耳光,兒子直接跳樓,如今女子已自殺身亡

2020年女子當眾扇兒子耳光,兒子直接跳樓,如今女子已自殺身亡

觀察鑒娛
2026-03-18 09:09:10
成吉思汗有一“特殊嗜好”,古代女人們苦不堪言,如今卻見怪不怪

成吉思汗有一“特殊嗜好”,古代女人們苦不堪言,如今卻見怪不怪

鶴羽說個事
2026-03-27 22:50:28
炸鍋!曼聯三大核心集體逼宮,新帥人選徹底穩了

炸鍋!曼聯三大核心集體逼宮,新帥人選徹底穩了

瀾歸序
2026-03-30 04:30:26
51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個電話讓他落淚

51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個電話讓他落淚

夢史
2026-03-25 11:33:08
孩子生病后買彩票中500萬媽媽發聲:孩子生病后家庭開支劇增,想著萬一中獎能貼補點家用

孩子生病后買彩票中500萬媽媽發聲:孩子生病后家庭開支劇增,想著萬一中獎能貼補點家用

觀威海
2026-03-27 09:27:12
曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

曼聯一億英鎊重磅引援取得進展,新任正式主帥人選已確定

林子說事
2026-03-30 07:47:53
2026年碼農集體失眠后,1本蘇聯小說把Claude寫崩了

2026年碼農集體失眠后,1本蘇聯小說把Claude寫崩了

全棧遛狗員
2026-03-29 16:07:00
王興興:下個月的比賽,機器人將跑得比人快!

王興興:下個月的比賽,機器人將跑得比人快!

財聞
2026-03-29 16:47:31
臺當局偷偷改了規矩:若解放軍戰機飛臨臺島,臺灣民眾只有3分鐘

臺當局偷偷改了規矩:若解放軍戰機飛臨臺島,臺灣民眾只有3分鐘

又是美好的日子
2026-03-26 20:26:28
中國人可能做夢都沒料到:最先超越特斯拉的,不是大眾,是比亞迪

中國人可能做夢都沒料到:最先超越特斯拉的,不是大眾,是比亞迪

悅君兮君不知
2026-03-28 16:19:15
太不公平了!唐山女子哭訴母親把家產給弟弟,卻在她家養老引熱議

太不公平了!唐山女子哭訴母親把家產給弟弟,卻在她家養老引熱議

火山詩話
2026-03-28 05:44:30
2026-03-30 09:04:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
467文章數 69關注度
往期回顧 全部

科技要聞

中國科學院院士:全固態電池或至少再等5年

頭條要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

頭條要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現!李榮浩喊話單依純侵權

財經要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

教育
本地
旅游
游戲
公開課

教育要聞

持續700年的功名之路,江南貢院九日考:古代科舉高考有多難?

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

旅游要聞

渝見好“村”光|銅梁譚洪村:毓青云霧里,譚洪一壺春

《生化危機7》的推出拯救了生化危機系列

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版