![]()
![]()
文/中國建設銀行辦公室丁煒
2026年初,OpenClaw開源AI智能體框架在開發者社區橫空出世,成為有史以來增長速度最快的開源軟件項目。OpenClaw在技術層面實現了從“對話AI”到“執行AI”的范式躍遷,用戶可以通過即時通訊(IM)軟件向智能體下達指令,由智能體自主完成郵件回復、材料搜集、研究報告撰寫、應用程序編碼等全流程操作,無需人工干涉,讓人們看到了“通用人工智能助手的早期雛形”。
OpenClaw究竟是智能體的“技術奇點”,還是資本市場的又一“新敘事”?OpenClaw以及2025年各家主流AI模型廠商發力的智能體賽道將對金融行業人工智能應用產生怎樣的影響,又能否破解當前金融機構的人工智能應用困局?
為什么大模型需要智能體
由于大語言模型(llm)只能提供一次輸入對應一次輸出的文本輸出,且模型存在輸出幻覺、數學計算弱、知識庫時效性、上下文限制等局限。單純使用大語言模型,更像是擁有一個“咨詢顧問”,而非“執行員工”,獨立的模型很難解決現實世界中遇到的工作和生活任務。智能體(Agent)的出現正是為了讓大語言模型具備連接現實世界的能力,實現從“對話框”到“實際生產力”的跨越。
智能體的概念最早在Stuart Russell和Peter Norvig所著的《人工智能:現代方法》(Artificial Intelligence:A Modern Approach,1995)中出現:智能體是任何可以被視為通過傳感器感知其環境、并通過執行器作用于該環境的事物。Russell和Norvig將智能體總結為一個公式:智能體=架構+程序。今天,業界普遍認為一個AI智能體應該具備環境感知、自主規劃、工具使用、記憶持久化和行動執行能力,通過多步驟推理并與外部環境交互,自主完成復雜的目標導向任務。
幾乎是在2022年底OpenAI發布ChatGPT的同一時間,LangChain以開源項目的形式在Github上發布,LangChain可以將大模型同其他工具連接,當時GPT3的能力還不足以覆蓋很多特定行業,LangChain最常用的做法就是通過其連接本地的文本知識庫,從而解決大模型無法覆蓋特定行業知識的弊端。數月后,OpenAI官方發布了ChatGPT插件(Plugins)支持,其中最主要的兩個插件是瀏覽和代碼解釋器,瀏覽可以使模型具備聯網能力,從而獲得最新的實時信息,而代碼解釋器主要讓模型具備數據分析和代碼生成能力,解決模型數據和代碼能力不足的弊病。同時,OpenAI還開放了插件商店,意圖吸引其他應用或是個人開發者在基于ChatGPT構建各類插件,打造屬于自己的“蘋果應用商店”。其中閱讀PDF文檔、獲取實時票務信息的插件在社區中使用較多。在2023年11月,OpenAI又發布了插件的升級版——GPTs,允許個人用戶創建特定用途的定制版本GPT,用戶可以通過簡單的提示詞預輸入和創建個人知識庫打造自己的“專屬智能體”。隨著中國的大模型在這一階段開始逐漸進入市場,中國的模型廠商也開始跟進智能體開發,智譜推出了對標GPTs的GLMs,2024年2月字節跳動上線扣子(Coze)低代碼的AI智能體開發平臺,扣子支持可視化的工作流編排,同時可以集成知識庫、飛書、抖音、剪映等工具,在對模型支持上,支持不同廠商的模型部署。
這一時期,雖然開源社區中的各類智能體“百花齊放”,然而卻鮮少有可以投入實際應用的智能。香港大學發表的論文顯示,這一時期主流開源Agent框架實際上都是“流水線”,規劃、工具調用和記憶均由人類預設好的邏輯編排,模型本身僅作為被動的文本生成器,智能體實際的任務完成率不到50%。如果讓智能體自主執行,智能體缺乏選擇調用哪個外部工具的能力。同時,智能體依靠在提示詞中重復引入上下文的機制,上下文窗口和記憶管理能力匱乏,使得智能體自身并不具備長思考、多步驟執行任務的能力。
隨著大語言模型能力的提升以及各家廠商開始發力人工智能應用,智能體開始迎來爆發時期。2024年11月,Anthropic開源了上下文協定(Model Context Protocol,MCP),MCP是讓大語言模型訪問和交互外部工具、環境和記憶的標準化協議,類似于計算機領域的USB標準——它不關心連接的是什么設備,只提供統一的接口協議。2025年3月,由中國團隊開發的“通用型自主AI智能體”Manus發布,在發布會上Manus首次實現了在單一提示詞下完成“復雜調研+網頁抓取+代碼編寫+PPT生成”的工作流程,一度引發“一碼難求”的測試熱潮。
OpenClaw的創新之處
OpenClaw是一個開源AI智能體框架,最初在2025年11月以“Clawdbot”名稱在GitHub上發布,后更名為OpenClaw。與Chatgpt等傳統聊天機器人應用不同,OpenClaw本質上可以在設備上運行的AI操作系統。OpenClaw可以通過連接已有應用,實現與真實世界交互的能力,在社區案例中,OpenClaw可以連接WhatsApp、Telegram、飛書、企業微信、QQ(機器人)等即時通訊工具,以及個人知識庫、IDE開發、智能家居、郵箱等生產力工具,用戶可以通過聊天軟件與其交互,OpenClaw調用在本地部署或通過調用云端的大模型API實現在本地電腦上執行真實的操作——例如寫代碼、發郵件、管理文件、控制瀏覽器搜索等。
在OpenClaw發布前,智能體依舊面臨著以下幾個問題。一是大部分智能體仍然是“特定工作流”,缺乏跨端跨場景通用性。主流廠商推出的智能體都是在云上運行的閉源服務,用戶很難根據自身的特定需求改變智能體的工作流程,更無法跨應用調度智能體,比如使用谷歌的智能體調用谷歌郵箱之外的郵箱應用。二是記憶缺失和有限的上下文窗口。甲骨文的技術文章中提到:“今天的智能體在對話之間遺忘一切,每次交互都從零開始,完全不記得你是誰或之前討論過什么。”在生產環境中,一個簡單的服務中斷事件響應歷史數據就在300萬token以上,遠超模型一次吞吐的最大窗口(200K)。三是智能體只能被動依靠人類指令推動,缺乏主動執行機制。智能體缺乏自主調度能力,不能在無人干預的情況下執行定時檢查郵件、監控服務器狀態或執行定期任務。(除非經過已經預設好的程序)
OpenClaw的創新之處在于不試圖通過提示詞工程讓LLM記住上下文,而是圍繞模型構建了一個標準化的執行環境——擁有完整的會話管理、記憶系統消息路由。用大模型提供智能決策,用OpenClaw提供操作系統。例如,OpenClaw通過編輯不同類型的Markdown文件,包括核心指令、個性化人格、使用工具和長期記憶,而這些文件均支持隨時編輯。此外OpenClaw的“心跳”機制定期會讀取工作區中的任務清單,自主判斷是否有項目需要執行。“心跳”機制讓智能體可以從被動接受人類指令響應,變成主動行動檢查是否有未完成工作的“員工助手”。在此基礎上,OpenClaw通過“技能”(SKILL)——一組已經注入好的提示詞,標明了需要的所有工具,每一個技能文件可能只有幾十行提示詞,但可以執行完整的工作流操作。
OpenClaw可以實現在不用人類干涉的情況下可以自主操控瀏覽器、郵箱、聊天工具等軟件,也可以構建完整構建一個可運行、功能完善的網站、應用,乃至軟件,這種通用性和不需要干涉的執行性是先前所有智能體框架均未具備的能力。因此OpenClaw的發布也引發了資本市場軟件行業“地震”。2026年伊始美股軟件板塊經歷了自2000年互聯網泡沫以來最劇烈的結構性拋售,Shopify、Salesforce、Adobe等知名軟件開發商股票下挫在20%—50%,美股軟件行業市值蒸發超1萬億美元。當智能體具備了替代“軟件功能+軟件操作者”的能力時,對傳統“按需付費”的SaaS生態產生了巨大沖擊,資本市場在此基礎上進一步炒作“人工智能對人類替代”概念,研究機構Citrini發表的虛擬研究報告《2028全球智能危機》是這一輪“AI替代”情緒的頂點,在報告中,作者描繪了一個智能體全面接管白領工作,失業率上升、全球經濟陷入購買力歸零的惡性負反饋,知識密集型崗位全部失靈的經濟危機圖景,進一步引發了各行各業對人工智能勞動替代的關注。
OpenClaw發布后,騰訊云、阿里云、火山引擎等國內主流云服務廠商第一時間在云平臺上推出了OpenClaw部署服務。3月,OpenClaw在國內引發應用熱潮,主流科技公司先后推出了集成自家工具(如騰訊集成企業微信和QQ,字節集成飛書等)的不同“Claw”。
OpenClaw能否幫助金融行業實現AI應用破局?
大語言模型的興起首先沖擊的就是傳統意義上“知識密集型”的行業,這其中金融、法律這類依靠“經驗”的行業最為明顯。本輪生成式人工智能浪潮興起之初,金融行業就對人工智能展現出濃厚興趣。起初,頭部金融機構都發力投入預訓練或微調“專有大模型”的方式投入,嘗試后發現在“規模法則”體系下,金融機構在模型訓練上完全無法于科技公司競爭,隨著模型規模和能力的不斷提升,在2024年主流大模型的知識能力就可以覆蓋金融行業需要的絕大部分知識,因此各金融機構紛紛轉向智能體開發。
起初,各家金融機構主要專注于“大模型+向量知識庫”的模式,即將自身的數據、制度文件、投研等知識文件構建本地的向量知識庫,用戶提出問題后首先由大模型分析用戶意圖轉入搜索,搜索后相關性較高的結果再交給大模型判斷并生成完整答案。摩根士丹利在2023年推出的“摩根士丹利助手”就是通過檢索數十萬份投研報告生成具體信息的投研助手。
而隨著大模型能力的進步,模型能力已經可以逐漸覆蓋金融機構自身的知識庫體系,金融機構則轉向將大模型嵌入自身現有的業務流程,對一些重復性、標準化程度高的工作流程進行人工智能改造,開發針對特定工作場景或流程的AI智能體。
摩根大通在2024年6月推出了LLM suite平臺,LLM Suite是一個大型的人工智能平臺,平臺上提供了多種針對不同業務板塊和流程的智能體,如為投資銀行部門提供自動生成投資銀行方案設計和營銷PPT的智能體、為法務人員提供提取指定信息自動生成合同的智能體以及為普通員工提供郵件內容總結和自動回復的智能體,根據摩根大通官方發布的數據,已有20萬名員工每天其專有的LLM Suite平臺。中國銀行業應用智能體的場景則更加豐富,除了傳統的客服、內部知識助手,工商銀行、建設銀行等國有大型商業銀行都推出了授信審批領域的智能體,支持無需人工干涉自動生成公司客戶調查報告。智能體通過內部數據抽取指定公司財務報告后,通過設定好的計算程序分析企業財務狀況,再由大模型結合具體行業生成報告內容及決策建議。瑞士銀行推出了AI Co-pilot平臺,支持分析公司數據并生成目標企業名單。投行人員可要求智能體列出特定類型客戶名單,如“符合客戶擴張戰略的歐洲中型科技公司”。貝萊德也在其知名的阿拉丁平臺上部署了財富顧問智能體,通過分析數據點,將投資組合公式轉化為易于理解和營銷的個性化客戶營銷報告。智能投顧方面,此外,各家金融機構在內部的科技研發流程中也已廣泛使用各類編程智能體摩根士丹利、工商銀行、建設銀行、招商銀行、花旗集團、摩根士丹利等多家金融機構均在年報中有所提及。
智能體開發屬于新興領域,且需要與大模型適配。公開信息顯示,多家金融機構在智能體開發中采用了與上游大模型廠商深度合作的方式進行。如工商銀行與智譜、華為開展合作、建設銀行與阿里云基于千問代碼模型共同開發編碼助手。高盛與Anthropic共同研發自動化交易與對賬智能體、KYC反洗錢智能體,Anthropic工程師直接與高盛團隊駐場6個月完成相應智能體開發。
框架的發布是否會對金融行業的人工智能應用產生“顛覆”影響?筆者認為,從目前的應用效果OpenClaw在金融行業應用仍面臨諸多挑戰。一是智能體框架無法解決大模型自身的弊端。今天所有的智能體框架,如果拆解其代碼,都是較為簡單的“工程邏輯”。回顧智能體的發展歷程,從早期的GPTs到現在的SKILL,智能體的出現更多是為了彌補大模型“沒有手和腳”的問題,而對“大腦”層面則沒有任何辦法。金融行業對準確性要求極高,在筆者的案例測試中,OpenClaw+Claude組合完成的研究報告,雖然已經要求其聯網進行了事實性核驗,但報告中仍出現了錯誤的引用與數據,且智能體還為其標注了虛構來源。二是智能體自身執行存在著較大的不確定和不可控性。在已經報告的測試案例中,出現了多起智能體未按指令操作,錯誤刪除文件或是錯誤發送文件,且人類指令無法停止操作的報告出現。三是OpenClaw的多智能體協作框架亦存在諸多問題,在研究機構的安全審計中就發現了512個安全漏洞。實際上,Anthropic、Google等大模型廠商已有近似于OpenClaw的智能體工具,而且技能體系也是Anthropic創建的,但各家的智能體生態較為封閉,OpenClaw作為一個開源框架,可以做到連接多個模型和應用。
盡管面臨挑戰,但是OpenClaw為代表的新一代智能體框架所呈現的技術路線已為業界所廣泛接受,在大模型自身能力面臨技術曲線放緩的背景下,通過智能體嵌入乃至改造業務流程仍將成為未來金融行業人工智能應用主線與趨勢。
金融行業智能體從“被動響應”轉向“主動決策”。目前的金融行業智能體,仍主要是基于“人工指定規則+大模型執行輸出”的“流水線模式”。相較于基于腳本和固定規則的執行模式,OpenClaw框架內的智能體采用目標驅動的決策方式,用戶只需定義目標而非步驟,智能體自主決定選用哪些工具、采用何種流程實現目標(也支持用戶自主規定流程)。相較于規則驅動,目標驅動的智能體決策可以在智能投顧、客戶分析篩選、主動風險管控等市場變化更強的業務場景中發揮更大作用。例如可構建智能體,接入新聞、招標等實時數據,判斷公司客戶重點營銷機會后生成定制化服務方案并實時推送給對公營銷部門。
加速金融業務能力的"技能化"封裝與敏捷迭代。技能(SKILL)已成為各大模型廠商支持的智能體核心組件與新標準。技能的定義與執行代碼完全解耦。開發者不再需要編寫大量重復代碼,而只需用自然語言和基本的執行邏輯程序描述執行路徑。筆者實測,上文中提到的財務分析智能體核心功能只需要不到100行代碼即可實現。金融行業的內控合規、風控規則、客服流程等都可以被封裝為獨立的技能模塊,并可以通過組合模式(直接復制技能文件)封裝到其他場景的智能體應用之中,提升復用率和產品迭代效率。例如當銀行為新的信貸產品開發線上系統時,即可通過引入已有的合規、風控技能模塊,由員工注入新的業務規則后由智能體完成新產品線上系統的代碼編程。
推動金融智能體走向復雜業務流程“深水區”。在現階段的智能體應用中大模型的“通才”局限和“工作流”串行執行使得智能體無法處理跨工作流、跨業務線的復雜業務場景。OpenClaw原生支持多智能體協同,不同智能體可擁有獨立的工作空間、差異化的技能集與隔離記憶,可以通過主智能體決策任務,子智能體執行工作流任務,檢查智能體核對任務完成進度的模式,開發更多跨業務條線的金融智能體。
金融行業AI智能體應用的對策路徑
加速流程再造,對業務流程進行人工智能原生化改造。當前智能體應用主流實踐仍停留在工作任務替代,在現有流程節點嵌入智能輔助,而非從業務邏輯源頭重塑,長期將形新瓶舊酒的局面,難以釋放人工智能的系統性價值。金融機構應當建立適配于人工智能環境的業務流程,以智能體可執行為前提,反向設計流程結構。凡是人工智能可直接生成輸出的環節,均應視為可改造節點,圍繞“人機協同決策”而非“人工逐層審批”重新設計流程鏈條。
完善數據治理,打造人工智能時代的數據核心競爭力。大模型公開訓練數據已接近飽和,私域數據的戰略價值已從生產要素躍升為核心競爭壁壘。金融機構人工智能應用的差異化競爭優勢,根本上源于對機構內部私域數據的深度挖掘與利用,尤其是客戶行為數據、知識數據等非結構化數據。金融機構應當建立企業級數據倉庫,以統一客戶視圖重新建立數據目錄,降低智能體數據獲取摩擦。同時要深化知識型數據應用,系統沉淀業務規則、專家經驗、操作邏輯等隱性知識,構建智能體知識圖譜與向量數據庫。
前瞻布局算力基礎設施,加強算力調度部署靈活性。金融機構的自有算力建設普遍采取線性增長規劃設計算力冗余。隨著人工智能技術應用的逐漸普及,用戶使用的增加以及更加復雜的推理鏈任務的增加,算力消耗將呈現指數級增長。同等任務情況下,OpenClaw框架下多智能體協作所需要的token是金融行業智能體“流式”對話的50-150倍。在前瞻規劃算力建設,增加算力冗余的同時,金融機構也應當思考更靈活的算力調度與部署方式。因為金融機構的數據保護需求,大部分金融機構的敏感數據信息均在私有環境部署,但巨大的算力投資并非所有金融機構都可以自身負擔,可通過智能體協同或模型協同的方式,建立跨算力資源的AI智能體,如由私有環境上運行的智能體處理數據信息,去除敏感標簽后,交由公有云上的智能體處理,形成“算力杠桿”。
積極擁抱開源,共建行業人工智能公用基礎設施。當前人工智能技術仍處在技術曲線的加速階段,金融機構在模型選擇和算力硬件投入上均面臨著“技術折舊”風險。在技術路線選擇上,應當積極擁抱開源生態,利用中國作為全球最大的人工智能開源貢獻方的本土優勢,在智能體建設上打造敏捷、靈活、開放的技術底座。當前,金融機構間重復低效建設人工智能應用形成了一定程度上的資源浪費,應在頂層設計上,積極推動金融行業公共人工智能基礎設施建設,構建開放、共享的技術底座。可以由大型金融機構的金融科技子公司共同提供資源打造金融行業人工智能公共基礎設施,并探索建立智能體技能交易市場,將各機構沉淀的通用智能體能力組件化、產品化,面向中小金融機構開放賦能,從根本上破解行業人工智能能力馬太效應。
來源 | 經作者授權發布
編輯 | 丁開艷
審核丨秦婷
責編 | 蘭銀帆
Review of Past Articles -
01
02
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.