![]()
兩天。二十一次代碼提交。英文指令進去,合并請求出來。
如果你從中間開始看這篇:第一篇講了16小時的構建過程——Telegram機器人進去,合并請求出來,端口適配器架構。第二、三篇是隨后的bug狩獵,包括一個花了5.84美元卻零產出的任務,迫使我們重新思考整個信任鏈條。這是系統熬過這一切之后的樣子。
沒有網頁界面的開發工具
MissionControl以一個Telegram機器人的形式運行。沒有網頁界面。沒有儀表盤。你發消息給它,它干活,它發消息給你。
每次交互都塞進一個聊天氣泡里。遛狗時用手機發任務,到家前收到PR鏈接。這個限制——所有東西必須裝進一條Telegram消息——結果成了特性,不是缺陷。
完整指令集如下:
不用切換上下文。不用瀏覽器標簽頁。
20%完成率的真實含義
頭48小時,三個項目,二十個任務。
完成率20%。看起來很差。其實不是。任務1到4全部栽在同一個CLI啟動問題上——第二篇里的零標準輸出bug。同一故障重試四次,我們才搞明白。bug修復沖刺之后,新任務的完成率跳到大概50%。
剩余失敗:預算超時,以及新注冊項目的權限問題。不是系統性的。
關鍵數字:四個完成的任務產出了能跑的代碼、通過的構建、合并的PR。其中一個——健身訓練師儀表盤——是完整的全棧Next.js應用,帶認證、數據可視化、PostgreSQL后端。自主構建。成本2美元。
每一層都是因為沒做它,然后出事了
預算上限。全局每天50美元。默認每個任務5美元,最高可配到10美元。任務啟動前檢查,由CLI自己的--max-budget-usd標志強制執行。任務#19——第三篇那個5.84美元零產出災難——證明光靠預算執行不夠。你還得驗證代理確實產出了東西。
超時機制。30分鐘軟限制,然后5分鐘寬限期。軟限制發SIGTERM。寬限期讓代理收尾并提交。寬限過后,SIGKILL。SIGTERM后60秒另設一個殺死計時器,確保沒東西掛著。Opus在雙核機器上分析大代碼庫,光是規劃就能燒掉15分鐘。硬碰硬學來的。
孤兒清理。進程重啟時,任何卡在運行狀態的任務重置為排隊。沒這個,單次PM2重啟就能凍住整個隊列。事后看很明顯。凌晨2點時不明顯。
提交驗證。git rev-list --count main..HEAD——如果為零,任務失敗。沒有例外。代理的自我評估("我成功完成了任務!")僅供參考,不是權威。我們不信任代理對自己工作的判斷。
未提交工作搶救。任何分支清理之前:git status --porcelain。如果有臟文件,git add -A && git commit -m 'WIP: auto-rescue'。捕獲代理做了但沒提交的工作——超時、崩潰、代理忘了暫存文件。發生頻率比預期高。
兩天。二十一次提交。英文進去,合并請求出來。
如果你從中間開始看這篇:第一篇講了16小時的構建過程——Telegram機器人進去,合并請求出來,端口適配器架構。第二、三篇是隨后的bug狩獵,包括一個花了5.84美元卻零產出的任務,迫使我們重新思考整個信任鏈條。這是系統熬過這一切之后的樣子。
MissionControl以一個Telegram機器人的形式運行。沒有網頁界面。沒有儀表盤。你發消息給它,它干活,它發消息給你。
每次交互都塞進一個聊天氣泡里。遛狗時用手機發任務,到家前收到PR鏈接。這個限制——所有東西必須裝進一條Telegram消息——結果成了特性,不是缺陷。
完整指令集如下:
不用切換上下文。不用瀏覽器標簽頁。
頭48小時,三個項目,二十個任務。
完成率20%。看起來很差。其實不是。任務1到4全部栽在同一個CLI啟動問題上——第二篇里的零標準輸出bug。同一故障重試四次,我們才搞明白。bug修復沖刺之后,新任務的完成率跳到大概50%。
剩余失敗:預算超時,以及新注冊項目的權限問題。不是系統性的。
關鍵數字:四個完成的任務產出了能跑的代碼、通過的構建、合并的PR。其中一個——健身訓練師儀表盤——是完整的全棧Next.js應用,帶認證、數據可視化、PostgreSQL后端。自主構建。成本2美元。
這里的每一層都是因為沒做它,然后出事了。
預算上限。全局每天50美元。默認每個任務5美元,最高可配到10美元。任務啟動前檢查,由CLI自己的--max-budget-usd標志強制執行。任務#19——第三篇那個5.84美元零產出災難——證明光靠預算執行不夠。你還得驗證代理確實產出了東西。
超時機制。30分鐘軟限制,然后5分鐘寬限期。軟限制發SIGTERM。寬限期讓代理收尾并提交。寬限過后,SIGKILL。SIGTERM后60秒另設一個殺死計時器,確保沒東西掛著。Opus在雙核機器上分析大代碼庫,光是規劃就能燒掉15分鐘。硬碰硬學來的。
孤兒清理。進程重啟時,任何卡在運行狀態的任務重置為排隊。沒這個,單次PM2重啟就能凍住整個隊列。事后看很明顯。凌晨2點時不明顯。
提交驗證。git rev-list --count main..HEAD——如果為零,任務失敗。沒有例外。代理的自我評估("我成功完成了任務!")僅供參考,不是權威。我們不信任代理對自己工作的判斷。
未提交工作搶救。任何分支清理之前:git status --porcelain。如果有臟文件,git add -A && git commit -m 'WIP: auto-rescue'。捕獲代理做了但沒提交的工作——超時、崩潰、代理忘了暫存文件。發生頻率比預期高。
兩天。二十一次提交。英文進去,合并請求出來。
如果你從中間開始看這篇:第一篇講了16小時的構建過程——Telegram機器人進去,合并請求出來,端口適配器架構。第二、三篇是隨后的bug狩獵,包括一個花了5.84美元卻零產出的任務,迫使我們重新思考整個信任鏈條。這是系統熬過這一切之后的樣子。
MissionControl以一個Telegram機器人的形式運行。沒有網頁界面。沒有儀表盤。你發消息給它,它干活,它發消息給你。
每次交互都塞進一個聊天氣泡里。遛狗時用手機發任務,到家前收到PR鏈接。這個限制——所有東西必須裝進一條Telegram消息——結果成了特性,不是缺陷。
完整指令集如下:
不用切換上下文。不用瀏覽器標簽頁。
頭48小時,三個項目,二十個任務。
完成率20%。看起來很差。其實不是。任務1到4全部栽在同一個CLI啟動問題上——第二篇里的零標準輸出bug。同一故障重試四次,我們才搞明白。bug修復沖刺之后,新任務的完成率跳到大概50%。
剩余失敗:預算超時,以及新注冊項目的權限問題。不是系統性的。
關鍵數字:四個完成的任務產出了能跑的代碼、通過的構建、合并的PR。其中一個——健身訓練師儀表盤——是完整的全棧Next.js應用,帶認證、數據可視化、PostgreSQL后端。自主構建。成本2美元。
這里的每一層都是因為沒做它,然后出事了。
預算上限。全局每天50美元。默認每個任務5美元,最高可配到10美元。任務啟動前檢查,由CLI自己的--max-budget-usd標志強制執行。任務#19——第三篇那個5.84美元零產出災難——證明光靠預算執行不夠。你還得驗證代理確實產出了東西。
超時機制。30分鐘軟限制,然后5分鐘寬限期。軟限制發SIGTERM。寬限期讓代理收尾并提交。寬限過后,SIGKILL。SIGTERM后60秒另設一個殺死計時器,確保沒東西掛著。Opus在雙核機器上分析大代碼庫,光是規劃就能燒掉15分鐘。硬碰硬學來的。
孤兒清理。進程重啟時,任何卡在運行狀態的任務重置為排隊。沒這個,單次PM2重啟就能凍住整個隊列。事后看很明顯。凌晨2點時不明顯。
提交驗證。git rev-list --count main..HEAD——如果為零,任務失敗。沒有例外。代理的自我評估("我成功完成了任務!")僅供參考,不是權威。我們不信任代理對自己工作的判斷。
未提交工作搶救。任何分支清理之前:git status --porcelain。如果有臟文件,git add -A && git commit -m 'WIP: auto-rescue'。捕獲代理做了但沒提交的工作——超時、崩潰、代理忘了暫存文件。發生頻率比預期高。
這套系統現在每天還在跑。下一個任務會是什么?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.