![]()
一家全球500強企業的IT團隊,平均每次系統故障要花4小時定位根因。HPE(慧與科技)上周甩出一組數據:他們的AI代理(AI Agent,一種能自主執行任務的智能程序)把這個時間直接砍半。
這不是實驗室demo。HPE全球CTO Fidelma Russo在拉斯維加斯舉辦的HPE Discover大會上現場演示——輸入自然語言問題,系統在幾分鐘內完成過去需要數小時的手動排查。
「我們不是在幫你更快點擊按鈕,我們是在消除點擊的必要性。」Russo的原話。這句話的潛臺詞很直白:傳統AIOps(智能運維)工具只是給舊流程套了個AI殼,HPE想連流程本身都端掉。
從「查日志」到「問AI」
技術細節來自HPE與英偉達的深度合作。雙方把英偉達的AI Enterprise軟件棧塞進HPE的私有云架構,再疊上自家開發的智能體框架。
具體怎么工作?想象一個場景:凌晨3點,支付系統告警。傳統模式下,值班工程師要依次登錄監控平臺、拉取日志、比對配置變更、排查依賴服務——平均17個步驟,涉及4個以上工具界面。
HPE的AI代理接管后,用戶用自然語言描述癥狀(「過去一小時支付成功率下降」),系統自動調用分布式追蹤、日志分析、配置數據庫,最終輸出一份帶修復建議的診斷報告。
關鍵差異在于「自主執行」。不是給你一堆圖表讓你自己看,而是代理自己完成查詢、關聯、推理的全過程。Russo演示的案例中,一個存儲性能瓶頸的定位,從人工4小時壓縮到8分鐘。
為什么是現在?
HPE押注的時機很有意思。2024年Gartner調研顯示,78%的企業IT預算正從「建設期」轉向「運維優化期」——云基礎設施已經鋪完,大家開始心疼每年燒掉的運維人力成本。
另一個背景是「告警疲勞」的真實傷害。PagerDuty 2023年報告統計,平均每個SRE(站點可靠性工程師)每周要處理47個告警,其中62%是誤報或低優先級。人不是被復雜問題壓垮的,是被海量噪音耗盡的。
HPE的產品邏輯切中這個痛點:與其讓工程師在Dashboard里疲于奔命,不如讓AI代理先過濾一遍,只把真正需要人類判斷的決策點拋出來。
落地姿勢:先私有云,再混合
目前這套方案綁定HPE的GreenLake私有云平臺,目標客戶是金融、醫療、制造這類數據不能上公有云的行業。Russo明確排除了「純公有云」路線——「企業級客戶要的是可控性,不是API調用次數的賬單驚喜。」
定價模式也反著來:按實際解決問題的次數計費,而非傳統的License(許可證)或算力消耗。HPE內部測算,一個中型企業的年度IT運維成本可因此下降30%-40%,主要來自夜班人力和外部供應商的減少。
競爭對手不會坐視。ServiceNow、Datadog、Splunk都在推類似的AI運維功能,但HPE的差異化在于「全棧可控」——從裸金屬服務器到AI模型推理,全用自己的硬件和調優過的軟件棧。
這種垂直整合的代價是靈活性,收益是穩定性。Russo的比喻很產品經理:「你愿意開一輛所有零件都是原廠的寶馬,還是一輛攢出來的性能車?企業客戶選前者。」
HPE沒有公布早期客戶的具體名單,只透露「多家全球Top 50銀行」正在POC(概念驗證)階段。一個被反復提及的反饋是:工程師第一次用時普遍不信任AI給出的結論,直到他們發現代理挖出的根因比自己手動排查還深兩層。
那個凌晨3點的值班工程師,現在能睡整覺了嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.