![]()
你是否還在一個個標簽頁之間來回切換,復制粘貼信息,手動完成那些重復性工作?大多數人使用 AI 的方式還停留在最初級的階段:輸入問題,獲得答案,然后自己動手完成工作。但有一小群人已經跨越到了完全不同的維度,他們讓 AI agent 自動管理郵件、日歷、廣告投放和日常運營,生產力提升了 10 到 20 倍。這不是夸張,而是正在發生的現實。
最近我深入研究了 Remy Gaskill 在 The Startup Ideas Podcast 上分享的一套 AI agent 工作流系統,這套方法讓我徹底重新思考了如何使用 AI。Remy 用一個非常簡潔的對比概括了這場變革:"從問答模式到目標-結果模式"。傳統的聊天就像打乒乓球,你來我往,但最終還是你在做事。而 AI agent 則完全不同,你給它一個目標,它會自己規劃步驟、執行任務、交付結果。這種差異看似微小,實則是生產力上的代際躍遷。當這種效率優勢在數周、數月的時間維度上累積,你會發現自己已經遠遠甩開了那些還在手動操作的人。
我花了很長時間消化這套方法論,因為它觸及了一個更深層的問題:我們與 AI 的關系正在從工具使用者轉變為團隊管理者。你不再是在使用一個軟件,而是在管理一支數字員工團隊。這種轉變需要的不僅是技術理解,更是思維方式的根本改變。
Agent 的運作原理:觀察-思考-行動循環
在深入討論如何構建 AI agent 系統之前,我覺得有必要先理解 agent 的底層運作邏輯。每一個 agent 都遵循同樣的三步循環:observe(觀察)、think(思考)、act(行動)。理解這個循環是掌握整套方法論的關鍵,因為它解釋了為什么 agent 能夠自主完成復雜任務,而不是簡單地響應單個指令。
![]()
Remy 用一個具體案例演示了這個循環的運作方式。假設你給 agent 一個任務:"為 Greg Eisenberg 搭建一個作品集網站。"agent 不會直接開始寫代碼,而是會啟動這個循環。第一步,它會檢查工作空間中是否有現有文件(observe)。發現沒有相關信息后,它會判斷需要先研究 Greg Eisenberg 是誰(think)。接著,它就會去執行這個研究工作(act)。完成研究后,循環重新開始。現在它掌握了研究成果,會思考:"我需要制定一個計劃。"于是它寫下計劃。再次循環,開始編寫代碼。又一次循環,啟動網站。再循環一次,截圖驗證任務是否完成。
我第一次看到這個流程時,感到既興奮又有些不安。興奮是因為這意味著 agent 真的可以像人類員工一樣分解復雜任務、自主決策。不安則是因為這要求我們必須清晰定義任務的完成標準,否則 agent 可能會陷入無限循環或者朝錯誤方向前進。但這正是關鍵所在:agent 會持續執行"觀察-思考-行動"循環,直到它能夠根據你設定的參數判斷任務已經完成。這種自主性是傳統自動化工具完全不具備的。
![]()
更讓我印象深刻的是,這套循環邏輯是跨平臺通用的。Claude Code、Codex、Antigravity、Cowork、Manus、OpenClaw,這些都只是不同的"agent harnesses"(agent 容器或框架)。Remy 把它們比作不同品牌的汽車。一旦你學會了如何開車——踩油門、剎車、轉方向盤——你就能開任何車。豐田也好,路虎也罷,雖然配置不同(座椅加熱、定速巡航等),但基本原理是相同的。Remy 現場演示了在 Claude Code、Codex 和 Antigravity 三個平臺上用同樣的提示詞構建作品集網站,三個都成功了。同樣的循環,不同的風味。這個洞察非常重要,因為它意味著你學到的技能是可遷移的,不會被某個特定工具鎖定。
![]()
構建 Agent 的大腦:agents.md 文件
理解了 agent 的運作原理后,接下來就是實踐部分。第一步是創建 agent 的"大腦"——一個 agents.md 文件。這聽起來很技術化,但實際上非常簡單直觀。我按照 Remy 的方法試驗了一次,才真正理解為什么這個文件如此關鍵。
首先在你的電腦上創建一個文件夾,比如叫"executive assistant"(執行助理)。現在這個文件夾是空的。如果你直接讓 agent 幫你寫一封商務開發郵件,它完全不知道你是誰、你賣什么產品、你的目標客戶是誰。結果就是它會生成一封通用的、毫無針對性的郵件,你還得花時間大幅修改。這就是大多數人使用 AI 時遇到的問題:每次都要重復提供背景信息,效率低下且令人沮喪。
![]()
解決方案就是 agents.md 文件。這是你的 agent 的系統提示詞(system prompt),會在每個任務開始前加載。你可以在里面放入你的角色、業務背景、個人偏好、使用的工具,以及你喜歡的工作方式。不同的 agent 框架對這個文件的命名略有不同:Claude Code 里叫 claude.md,Codex 和 OpenClaw 里叫 agents.md,Gemini 里叫 gemini.md。但概念完全相同:一個 markdown 文件,在 agent 開始工作前給它提供上下文。
這里有個非常實用的技巧。你可以用任何聊天模型來構建這個文件。只需說:"用訪談的方式問我問題,提取所有你需要的上下文信息,然后幫我構建一個 agents.md 文件。"模型會從你腦子里把信息都挖掘出來,并且結構化地整理好。我試過這個方法,效果驚人。模型問了我大概 15-20 個問題,從我的工作角色、公司業務、目標客戶、溝通風格、常用工具,到我對郵件簽名的偏好,全部提取出來并生成了一個完整的 agents.md 文件。
這標志著從"提示詞工程"(prompt engineering)到"上下文工程"(context engineering)的重大轉變。當你給 agent 加載了足夠多關于你業務的信息后,你的提示詞可以簡單到令人發笑。"給我寫封商務開發郵件"就夠了,因為上下文已經全在那里了。agent 知道你是誰、你在推銷什么、你的語氣風格,甚至知道你喜歡在郵件結尾用什么樣的簽名。這種工作方式的效率提升是指數級的,因為你不再需要每次都重復提供背景信息,可以直接進入核心工作。
給 Agent 配備記憶:memory.md 文件
構建好 agents.md 后,下一步是解決一個關鍵問題:記憶。我在使用 ChatGPT 等聊天模型時經常遇到這種情況:你告訴它"我最喜歡的顏色是薰衣草紫",它說"明白了"。但下一次會話時,它完全不記得了。這非常令人沮喪,因為你不得不反復糾正同樣的問題。
ChatGPT 這類聊天模型有自動記憶功能,它們會在云端保存信息,但你無法控制。Agent 的工作方式不同,你可以自己控制記憶。Remy 的解決方案非常優雅:在 agents.md 文件中添加兩行指令。第一行:"在每個任務開始前讀取 memory.md 文件"。第二行:"當我糾正你或者你學到新東西時,更新 memory.md 文件"。然后在同一個文件夾中創建一個空白的 memory.md 文件。
![]()
現在,當你說"別寫得那么正式",agent 會在 memory.md 中更新記錄:"保持語氣隨意,永遠不要正式"。每次未來的會話都會繼承這個偏好。這就像訓練一個真正的員工。優秀的員工會記住你的偏好并隨著時間不斷改進,你的 agent 也應該如此。我按照這個方法配置后,發現 agent 的表現確實會隨著時間推移越來越符合我的期望。它會記住我不喜歡用"顯著"這個詞,會記住我傾向于用數據支撐觀點,會記住我喜歡簡短的段落而不是長篇大論。
Remy 給出了一個最佳實踐建議:保持 agents.md 文件在 200 行以內。如果你的 memory.md 文件開始保存一些微小的修正,可以更新指令說"只保存實質性的修正"。你隨時可以手動清理這個文件。這個建議很重要,因為如果記憶文件變得過于龐大和混亂,反而會影響 agent 的表現。保持信息的精煉和結構化,是讓 agent 高效運作的關鍵。
連接你的工具:MCP 協議
有了大腦和記憶后,agent 仍然是孤立的。它只能在自己的小世界里工作,無法訪問你日常使用的各種工具和平臺。這就引出了下一個關鍵組件:MCP(Model Context Protocol,模型上下文協議)。
默認情況下,大多數 agent 框架只自帶網頁搜索功能。就這一個。要連接 Gmail、Google Calendar、Notion、Stripe、Granola 或其他你使用的工具,你需要 MCP。Remy 用了一個非常簡潔的比喻來解釋 MCP 的價值。在 MCP 之前,你的 agent 必須學習每個工具的"語言"。Claude 說英語,Notion 說西班牙語,Gmail 說法語,Slack 說中文。連接它們需要針對每個工具進行定制開發,成本高昂且復雜。
![]()
Anthropic 開發了 MCP 作為通用翻譯器。你的 agent 仍然說英語,你的工具仍然說它們各自的語言,MCP 坐在中間進行雙向翻譯。這個協議的出現大大降低了 agent 系統的構建門檻。現在大多數框架都讓連接變得非常簡單。Cowork、Codex、Manus 和 Perplexity 都有"連接器"或"技能"菜單,你可以瀏覽應用并登錄,一鍵完成。
一旦連接完成,這才是真正的生產力飛躍發生的地方。Remy 做了一個現場演示,讓我印象極其深刻。他讓一個 agent 總結收件箱、從 Granola 提取會議筆記、創建一個 Stripe 付款鏈接、在 Notion 中設置一個項目、起草一封后續跟進郵件。一個提示詞,agent 觸及了每個工具,Remy 沒有切換任何一個標簽頁。他說:"即使你只是能把某件事做快七倍,不需要進入所有這些工具,這種效率提升真的會開始復利。"
我自己嘗試后,這種體驗確實令人震撼。我讓 agent 檢查我的日歷、總結今天的會議、從 Notion 中提取項目狀態、在 Slack 上給團隊發送更新、創建一個跟進任務。整個過程在兩分鐘內完成。如果我手動操作,至少需要 15-20 分鐘,還要在多個應用之間來回切換,思維不斷被打斷。這種無縫的工作流整合,才是 AI agent 真正的價值所在。它不是替代某個工具,而是成為所有工具的協調者,讓信息和行動在不同平臺間自由流動。
構建技能:AI 的標準作業流程
如果說 agents.md 是大腦,memory.md 是記憶,MCP 是手腳,那么 skills(技能)就是專業知識和經驗的積累。這是整套系統中最具復利效應的部分,也是我認為最被低估的組件。
把技能理解為標準作業流程(SOP),但是為你的 agent 準備的。你解釋一次流程,agent 就能每次完美重復。沒有技能的情況下是這樣的:你讓 agent 寫一份客戶提案,你們來回溝通 30 分鐘,改格式、把價格移到底部、用這個藍色色調。最終得到一個不錯的結果。但下周,你又得從頭開始。有技能的情況下:agent 加載你的提案技能,它已經知道格式、顏色、價格應該放在哪里。幾分鐘搞定。
Remy 介紹了兩種創建技能的方法。方法一:提供源材料。他拿了一個關于病毒式傳播鉤子(viral hooks)的完整課程文本,上傳給 agent,然后說"基于這個課程給我構建一個病毒式鉤子技能"。agent 就把它打包成一個 .skill 文件,包含指令和參考材料。方法二:從實際會話中構建。和 agent 一起手動完成一個流程,當你對結果滿意時,說"為我們剛才做的創建一個技能"。它會把整個工作流打包起來。
Remy 分享了一個真實案例,特別能說明技能的價值。他構建了一個廣告庫分析技能,方法是和 Claude 一起走一遍完整流程:抓取競爭對手的廣告、截圖落地頁、分析文案和創意、生成一份主報告。這個流程過去需要 3-4 小時。現在他只需輸入兩個詞,技能就會運行。我算了一下,如果他每周做兩次這樣的分析,一年就能節省 300-400 小時。這些時間可以用來做更有戰略價值的工作,而不是機械性的信息收集和整理。
更關鍵的是,技能是可以累積的。如果你每周自動化 3-5 個微小的手動流程,最終你會自動化整個工作流。這不是一夜之間發生的,而是一個漸進的過程。但正因為是漸進的,它可持續、可控制。你不是突然把所有工作交給 AI 然后祈禱它不出錯,而是一點一點地將那些重復性、規則明確的任務轉化為技能,逐步優化和完善,直到整個系統穩定可靠。
技能鏈接和任務調度
當你積累了足夠多的技能后,真正的魔法開始顯現:技能鏈接。單個技能很有用,但當你把多個技能組合起來,就能創造出完全自主的工作流。
Remy 舉了一個會議準備的例子。一個會議準備技能會研究嘉賓并整理談話要點。一個播客研究技能會深入挖掘嘉賓的背景。一個晨間簡報技能會檢查你的日歷,如果看到有播客安排,就自動觸發研究技能。這種技能的級聯調用,創造了一種近乎魔法的體驗:你醒來,打開電腦,晨間簡報已經準備好了,今天的播客嘉賓的完整背景資料也躺在那里,你只需要快速瀏覽然后開始錄制。
![]()
現在大多數框架都支持定時任務。你可以設置晨間簡報技能每天早上 9 點運行。它會檢查你的日歷、總結收件箱、從 Notion 提取項目更新、交付一份每日行動計劃。我設置了這樣一個流程后,發現它徹底改變了我開始一天工作的方式。過去我需要花 30-45 分鐘"進入狀態",檢查郵件、看日歷、回顧待辦事項。現在這些都在我坐下來之前就完成了,我可以直接進入深度工作。
Remy 分享了一個更激進的案例。他正在購買一輛特定顏色、特定配置的汽車。每三小時,一個 agent 會自動抓取 CarMax、Cars.com、Autotrader 等市場平臺,如果有匹配的車出現,就發送通知給他。這為他每天節省了大約一小時的瘋狂刷新標簽頁的時間。這個例子讓我意識到,agent 不僅可以處理工作任務,還可以接管生活中那些耗時但重要的監控任務。
我開始思考更多可能性。一個 agent 可以監控特定主題的新聞,每天生成行業動態摘要。另一個可以跟蹤競爭對手的產品更新和定價變化。還有一個可以監控社交媒體上關于你品牌的提及,識別需要響應的重要評論。這些都是過去需要專人負責或者完全忽略的任務,現在可以完全自動化。
運營整個業務的文件夾結構
當你開始系統化地構建 agent 團隊時,組織結構變得至關重要。Remy 分享了他的完整設置,這個結構非常有啟發性。
他為每個公司或客戶創建一個大文件夾。里面按部門劃分子文件夾:executive assistant(執行助理)、content team(內容團隊)、head of marketing(營銷主管)、sales(銷售)。每個子文件夾都有自己的 agents.md、memory.md、技能文件夾和 MCP 連接。營銷 agent 知道廣告創意規則,內容 agent 知道品牌語氣,執行助理知道你如何簽署郵件。在頂層,一個總管 agent 管理所有這些。
這個結構讓我想到真實公司的組織架構。每個部門有自己的知識庫和工作方式,但都向同一個目標努力。Remy 還提到了全局技能和項目級技能的區分。有些技能適用于所有場景,比如"讓這個更簡潔"的技能,這些應該放在全局。而"將某人轉介給 Sebastian"這樣的技能只屬于執行助理文件夾,應該保持在項目級別。
我按照這個思路整理了自己的 agent 系統,發現這種組織方式確實大大提高了可管理性。過去我把所有東西都塞在一個文件夾里,結果是技能互相沖突,記憶文件變得臃腫,很難追蹤哪個 agent 負責什么。現在每個 agent 都有明確的職責范圍和知識邊界,整個系統變得清晰可控。
更重要的是,這種結構是可擴展的。當你想添加一個新職能,只需創建一個新文件夾,配置相應的上下文和技能,就可以立即投入使用。當某個 agent 的表現不佳時,你知道確切在哪里進行調整。這種模塊化的設計讓整個系統既強大又靈活。
如何開始
看到這里,你可能會覺得這套系統很復雜,不知道從哪里入手。Remy 給出了一個非常清晰的起步路徑,我認為這個路徑既實用又循序漸進。
第一步,選擇一個 agent 框架。Remy 推薦 Cowork 作為初學者的最佳選擇,因為它的界面最友好、設置最簡單。但正如前面提到的,一旦你理解了基本原理,切換到其他框架非常容易。
第二步,創建一個叫"executive assistant"的文件夾。從執行助理開始是明智的,因為這個角色涉及的任務類型最廣泛,能讓你快速看到價值。
第三步,使用訪談式提示詞構建你的 agents.md 文件。這一步不要著急,花時間把上下文建立好,后面會節省大量時間。
第四步,添加帶有自動更新指令的 memory.md 文件。
第五步,通過 MCP 連接你最常用的工具。不要一次性連接所有工具,從 3-5 個最核心的開始。
![]()
第六步,這是最關鍵的:開始使用 agent 處理真實任務。不要只是測試,要讓它參與你的實際工作。當你發現自己重復執行某個流程時,把它轉化為技能。第七步,每周自動化 3-5 個小流程。這個節奏是可持續的,不會讓你overwhelmed(不知所措),但會穩步積累。
我自己的經驗是,前兩周會感覺有些笨拙,因為你在學習如何與 agent 有效溝通,如何構建好的上下文和技能。但過了這個階段,效率提升會變得非常明顯。我現在每天早上的第一件事不再是手動檢查郵件和日歷,而是查看 agent 準備好的晨間簡報。我寫郵件的時間從平均每封 5-10 分鐘降到了 1-2 分鐘,因為 agent 已經掌握了我的寫作風格和常用模板。
Remy 強調了一點我非常認同:真正未來導向的技術棧是你電腦上的 markdown 文件。各種框架會不斷變化,但你的上下文文件、記憶和技能可以遷移到任何一個。這意味著你投入的時間和精力不會因為某個工具被淘汰而浪費。你構建的是一套可遷移的數字化工作流資產。
我對這套方法的深度思考
在深入研究并實踐了這套 AI agent 工作流系統后,我有一些更深層的思考,這些思考超越了具體的技術細節,觸及了我們與 AI 關系的本質。
我認為這套方法最深刻的地方在于,它重新定義了"自動化"這個概念。傳統的自動化是預先編程的、僵化的,只能處理完全相同的場景。而基于 AI agent 的自動化是適應性的、情境感知的。它不是簡單地執行固定步驟,而是根據具體情況做出判斷。這種差異是根本性的。一個傳統的自動化腳本會在遇到意外情況時崩潰,而 AI agent 會調整策略。這意味著你可以自動化那些過去被認為"太復雜、變數太多"的任務。
我也注意到一個有趣的悖論:agent 越智能,你需要的技術技能越少,但對業務理解的要求越高。過去,構建自動化系統需要編程能力,但不一定需要深刻理解業務邏輯。現在,你不需要寫代碼,但你必須能夠清晰表達任務目標、定義完成標準、識別關鍵決策點。這是一種不同類型的技能,更偏向戰略性思維和流程設計。
從更宏觀的角度看,這套方法體現了一種新的工作哲學:壓縮繁瑣工作,專注關鍵決策。Remy 在文章結尾說:"你不是在替代自己,而是在壓縮瑣事,這樣你就能專注于真正重要的決策。"這句話點出了核心。AI agent 的價值不是讓你失業,而是讓你的時間用在更有價值的地方。那些重復性、規則明確、不需要創造性的任務,應該被自動化。而那些需要判斷、創意、同理心和戰略思維的工作,應該得到更多時間和精力。
我還思考了這套系統的復利效應。每個技能的價值可能不大,但當你積累了 50、100 個技能后,整個工作方式會發生質變。就像復利投資一樣,前期看不出太大差別,但隨著時間推移,曲線會陡然上升。Remy 說"把一周的工作壓縮進一天",這不是夸張,而是數學上的必然結果。如果每個任務都快 5-10 倍,一天確實可以完成過去一周的工作量。
但我也看到一些潛在的陷阱。過度自動化可能讓人失去對細節的感知,過度依賴 agent 可能削弱自己的技能。我的應對策略是:定期審查 agent 的輸出,確保質量不下降;有意識地保留一些手動工作,保持技能的活躍;把 agent 當作助手而非替代品,最終決策權始終在人類手中。
最后,我認為這套方法預示了一個更大的趨勢:個人生產力的極大提升將重新定義競爭。過去,一個人的產出受限于時間和精力,現在,通過 AI agent,一個人可以擁有一個小團隊的產出能力。這會讓小團隊和個人創業者具備前所未有的競爭力,因為他們可以以極低的成本實現過去需要大團隊才能完成的事情。我們可能正在見證"一人公司"時代的真正到來。
底層邏輯:從工具到團隊
回到最開始的問題:為什么大多數人還停留在 AI 使用的初級階段?我認為根本原因在于思維模式的差異。大多數人把 AI 當作工具,一個更聰明的搜索引擎或寫作助手。但那些生產力提升 10-20 倍的人,已經把 AI 當作團隊成員。
這不僅僅是用詞上的區別,而是完全不同的使用方式。當你把 AI 當作工具時,你會在需要時調用它,用完就關閉。當你把 AI 當作團隊成員時,你會給它持續的上下文、教它記住偏好、構建它的技能庫、讓它主動承擔職責。就像管理人類員工一樣,你投入的培訓和指導越多,它的產出就越好。
這套由 Remy 分享的系統,本質上就是一套"管理數字員工"的方法論。agents.md 是員工手冊,memory.md 是工作日志,skills 是專業技能,MCP 是工作權限。整個結構映射了人類組織的管理邏輯。理解了這一點,你就能明白為什么這套系統如此強大:它不是在優化工具使用,而是在構建一個可擴展的、能夠自我改進的數字化團隊。
循環非常簡單:連接工具 → 構建上下文 → 創建技能 → 自動化流程 → 重復。從執行助理開始,本周構建一個技能,下周再構建一個。把這個過程堆疊數月,你就能把一周的工作壓縮進一天。這不是科幻,而是現在就可以實現的現實。
來源 | 深思圈(ID:Deep_Think_Circle)
作者 | 深思圈 ; 編輯 | 呼呼大睡
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.