網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

四子棋被"弱解"了：人類用8張圖記住必勝套路

2026-04-12 08:08:47　來源: 硅嶼手記

北京舉報

分享至

一個7×6的棋盤，42個格子，4531985219092種合法局面。這是四子棋（Connect 4）的復雜度——比國際象棋開局多幾個數(shù)量級。但有人證明：你不需要記住萬億種變化，只要8張決策圖就能保證先手必勝。

這不是強解，是"弱解"。區(qū)別很微妙，卻改變了我們對"完美游戲"的理解。

強解 vs 弱解：兩種"完美"的代價

強解意味著你知道每一個局面的理論結(jié)果。四子棋早在1988年就被Victor Allis強解，后來John Tromp在2012年壓縮到8GB數(shù)據(jù)庫。但8GB是什么概念？你背不下來，比賽時也沒法查。

弱解則走另一條路：它只保證你贏，不告訴你其他路怎么走。用作者的話說，"Red（先手）只學對自己有利的分支，冗余信息一概丟棄"。

類比一下：強解像背下整本《牛津英語詞典》，弱解像只背雅思高頻詞表——目標明確，效率極高。作者把強解比作"策略A"：現(xiàn)場算所有變化；弱解是"策略B"：賽前背完，上場零搜索。

兩種策略的"數(shù)據(jù)產(chǎn)品"相同（都完美），但生產(chǎn)邏輯截然相反。一個依賴算力，一個依賴知識。

WeakC4的核心設計：給必勝路徑造一門"語言"

這套方案叫WeakC4，關(guān)鍵創(chuàng)新是"語言"——不是自然語言，是一套能描述必勝節(jié)點的符號系統(tǒng)。作者發(fā)現(xiàn)：四子棋的必勝路徑有結(jié)構(gòu)性重復，可以用少量模式覆蓋。

具體怎么做？先鎖定一小部分節(jié)點（必勝關(guān)鍵位置），給它們設計描述語法；再構(gòu)建一個極小的開局樹，確保所有葉子節(jié)點都落在那套語法能描述的范圍內(nèi)。

結(jié)果是：先手第一步必須走中間列（第4列）。這是唯一被證明的必勝起點。走其他列？弱解不回答，因為"那些分支對Red不是好選擇"。

這種"選擇性失明"是刻意的設計，不是缺陷。

為什么弱解可能比強解更有價值

作者提出一個反直覺觀點：強解是"通用的、樸素的方法"，不需要理解游戲結(jié)構(gòu)；弱解反而留出"創(chuàng)造性選擇的空間"，能表達人對游戲的洞察。

想想實際場景。你去參加四子棋比賽，帶8GB數(shù)據(jù)庫不現(xiàn)實，但帶8張打印好的決策圖完全可行。WeakC4的目標就是可執(zhí)行性——讓完美策略從"理論存在"變成"人類可用"。

這觸及一個深層問題：我們對"解決游戲"的定義是否太偏理論？如果一種解法無法被人類在實戰(zhàn)中調(diào)用，它的"完美"有多少意義？

作者用圖論語言區(qū)分兩者：強解是整個游戲樹，弱解是一個子圖，且滿足"閉包"約束——從任意包含節(jié)點出發(fā)，按弱解走法不會走到子圖外面。這個數(shù)學保證讓弱解雖不完整，卻絕對可靠。

從四子棋到更復雜的游戲

四子棋已被強解，WeakC4的價值在于方法論。對于圍棋、象棋等尚未強解或強解數(shù)據(jù)量爆炸的游戲，弱解可能是更務實的目標。

作者暗示的方向是：不必追求"全知"，而是識別"足夠贏"的知識邊界。這類似于機器學習里的"蒸餾"——把大模型的能力壓縮到小模型，損失一些泛化性，換取部署可行性。

WeakC4的代碼和決策圖已開源。8張圖的具體內(nèi)容？原文沒展開，但邏輯很清楚：中間列開局，然后按圖索驥。沒有搜索，沒有估值函數(shù)，純記憶驅(qū)動。

這種極端方案能工作，恰恰因為四子棋的必勝結(jié)構(gòu)比想象中"窄"——先手優(yōu)勢足夠大，大到可以用有限模式覆蓋所有關(guān)鍵變化。

最后一個細節(jié)：作者在描述兩種策略時，數(shù)據(jù)產(chǎn)品"identical"的句子被截斷了。但意圖很明顯——無論A還是B，最終都輸出完美著法。路徑不同，終點相同。你會選哪條路？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

16歲棋手給基努·里維斯寫郵件，對方回了

熱搜摘要官 2026-04-12 08:33:55
0 跟貼 0
首屆“天長杯”全國象棋公開賽在天長開幕助力打造棋藝名城

金臺資訊 2026-04-12 09:56:10
0 跟貼 0

“空中小摩托”無人機：演習必攔，實戰(zhàn)為啥難防？

山木科普 2026-04-10 21:08:22
20 跟貼 20

重構(gòu)馬克思主義：市場經(jīng)濟與制度的耦合

生命可以承受之輕 2026-04-12 09:21:50
1 跟貼 1
翼裝飛行人員密封訓練，過程中還會翻滾，實戰(zhàn)操作在千米高空！

奧力給趣笑堂 2026-04-11 14:36:56
1 跟貼 1

以色列襲擊黎巴嫩被譴責，內(nèi)塔尼亞胡：“以軍是世界上最有道德的軍隊”；此前以色列對黎巴嫩發(fā)動襲擊，造成包括兒童在內(nèi)數(shù)百名平民死傷

揚子晚報 2026-04-11 11:33:21
71924 跟貼 71924

人類首例“被恐龍咬傷事件”！男子把頭伸進恐龍模型里被卡住，當事人：沒想到它會不松口大家別跟我學 #

開屏新聞客戶端 2026-04-11 18:04:45
0 跟貼 0
全球AI軍備競賽：7成模型困在英語里，非英語市場正在掀桌

閃存獵手 2026-04-10 09:29:35
0 跟貼 0

沉沒成本不參與重大決策，遇到錯的人要及時止損！

肚子又圓啦嗚嗚嗚 2026-04-10 14:12:51
1 跟貼 1
那個“愛馬仕”，想拯救“智障”小龍蝦

36氪 2026-04-11 11:49:04
0 跟貼 0
常州第1、無錫第2，首輪“蘇超”積分榜來了！

江南晚報 2026-04-11 21:54:38
131 跟貼 131
幫爺爺賣萵筍，這小女孩有腦子還有策略，將來必定前途無量

俄羅斯安娜 2026-04-09 00:40:18
0 跟貼 0
解鎖單賽季2000分最高齡紀錄！杜蘭特：詹姆斯不在榜單上嗎？

北青網(wǎng)-北京青年報 2026-04-11 15:44:18
123 跟貼 123
體壇聯(lián)播｜巴薩大勝西班牙人9分領(lǐng)跑，利物浦止住三連敗

澎湃新聞 2026-04-12 09:16:28
2 跟貼 2
60141人見證歷史，上海德比又刷新上座率、票房紀錄，中超竟然吊打蘇超？

上觀新聞 2026-04-12 04:34:08
188 跟貼 188
組裝川崎忍者模型套件

制造科技 2026-04-09 19:07:20
39 跟貼 39
城市更新顛覆購房邏輯，財富縮水風險

紀超講樓市 2026-04-08 06:16:42
0 跟貼 0
一天僅需5毛錢，開源框架替你半夜跑實驗！7*24小時待命

新智元 2026-04-12 10:02:55
0 跟貼 0
新概念五行實戰(zhàn)心法——三步法：一小時從認知升維到萬物應用丨五行之“木”

若道占星 2026-04-12 08:36:43
0 跟貼 0
常州，贏了！

極目新聞 2026-04-11 22:01:13
71 跟貼 71
上海德比為申花破門，拉唐收獲萊昂納多擁抱

上觀新聞 2026-04-12 07:44:04
1 跟貼 1
續(xù)航100公里僅跑30公里充電31秒電量猛漲10% 東莞網(wǎng)約車司機：深藍SL03虛到不敢接單

信網(wǎng) 2026-04-11 17:05:04
1889 跟貼 1889
先發(fā)制人：揭秘日本侵略意圖的應對策略

山秀溪清m 2026-04-10 13:10:47
0 跟貼 0
通往佛山莫氏雞煲店的道路即將完工，預計下周可通行，老莫：我想縮小店面

極目新聞 2026-04-11 15:20:15
261 跟貼 261
每一個看似精明的家庭決策，都可能是一場慢性自殺

枯葉蝶兒 2026-04-08 03:36:21
1 跟貼 1
面試官說Dijkstra寫不出來就滾，我用2個循環(huán)讓他閉嘴

閃存獵手 2026-04-12 08:42:24
0 跟貼 0
標120W的充電器實際功率僅22.5W，商家：120W是產(chǎn)品型號

極目新聞 2026-04-11 00:53:31
4 跟貼 4
山東一公司年會總獎金超千萬元，36名員工現(xiàn)場數(shù)錢，8名高管獲贈166平方米房產(chǎn)，公司員工：數(shù)錢最多的人拿了1萬多元

極目新聞 2026-04-11 13:01:17
560 跟貼 560
特斯拉FSD V14.3停車，比我決策快、比我行動快、比我更絲滑

不看車bukanche 2026-04-08 16:09:52
334 跟貼 334
適合上海高中生的英語提分方案，1個月解決單詞，可沖擊130+高分

大咖看教育 2026-04-10 20:24:10
7 跟貼 7
蘇超賽場刮起“新吳旋風”

無錫高新區(qū)在線 2026-04-12 10:38:21
0 跟貼 0
埃雷拉：貝爾薩就是個足球瘋子，他會在午休時和你談比賽安排

懂球帝 2026-04-12 10:35:08
0 跟貼 0
河南后衛(wèi)已回防到位！為何王國明還要出擊送魯能空門，原因找到了

張麗說足球 2026-04-12 10:36:57
0 跟貼 0
孔帕尼：希望大家給小鹿一點耐心，大傷的球員需要時間找感覺

懂球帝 2026-04-12 10:35:08
0 跟貼 0
美國豆農(nóng)：越來越依賴中國去年仍有大量庫存尚未出口

澎湃新聞 2026-04-11 14:06:46
361 跟貼 361
田校長是遇上對手了、語言邏輯非常強的一個孩子、思維敏捷！

灼眼的SABER噠 2026-04-11 09:34:29
0 跟貼 0
彈盡瞬間的鋼鐵停頓經(jīng)典56式半自動空倉掛機的反饋邏輯

武器知識 2026-04-10 23:53:03
0 跟貼 0
月租萬元小區(qū)部分房屋變身研究生宿舍？深圳大學回應每經(jīng)：相關(guān)事項仍在推進中

每日經(jīng)濟新聞 2026-04-11 12:30:07
181 跟貼 181
微信開啟“方言采集”返紅包活動有人累計“薅”到幾百元

極目新聞 2026-04-11 18:39:53
206 跟貼 206
多家快遞公司，宣布漲價

魯中晨報 2026-04-11 13:36:04
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

四子棋被"弱解"了：人類用8張圖記住必勝套路

強解 vs 弱解：兩種"完美"的代價

WeakC4的核心設計：給必勝路徑造一門"語言"

為什么弱解可能比強解更有價值

從四子棋到更復雜的游戲

換帥之后，他們從降級區(qū)沖到升級區(qū)

美國副總統(tǒng)萬斯：美伊談判未能達成協(xié)議 將返回美國

美國副總統(tǒng)萬斯：美伊談判未能達成協(xié)議 將返回美國

鄭鈞回應兒子走路：會監(jiān)督他挺直腰板

三輪磋商談至深夜 美伊談判三大議題仍待解

理想稱遭惡意拉踩，東風日產(chǎn)：尊重同行

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

游客漲、預訂旺 “春日經(jīng)濟”催熱八桂消費市場

華為暢享90 Pro Max一戰(zhàn)封神，周銷量超iPhone 17全系

于細微處見真功——初中學校黨建工作如何抓細節(jié)

重新點燃愛的火花：產(chǎn)后如何找回那份激情與高潮？

伊朗議長帶四名遇難兒童照片赴美伊談判

美國副總統(tǒng)萬斯：美伊談判未能達成協(xié)議將返回美國

美國副總統(tǒng)萬斯：美伊談判未能達成協(xié)議將返回美國

三輪磋商談至深夜美伊談判三大議題仍待解

煥新極氪007/007GT上市限時19.39萬起