網易首頁 > 網易號 > 正文申請入駐

OpenTelemetry追了3年LLM，生產環境還是靠人工兜底

2026-03-26 13:45:01　來源: 爬蟲飼養員

北京舉報

分享至

去年有個數據挺有意思：Grafana Labs的調研顯示，78%的AI團隊把"可觀測性"列為2024年最高優先級投入。但同一批受訪者里，63%承認他們的LLM故障響應時間仍超過15分鐘。

錢花了，dashboard漂亮了，凌晨兩點的告警短信也沒少收。問題出在哪？

追蹤能告訴你"發生了什么"，但沒說"怎么修"

OpenTelemetry最近標準化的LLM追蹤確實是個進步。Spans、traces、生成式AI的語義約定——這些基礎設施層面的統一，讓跨工具調試變得可行。

作者在這塊觀察了很久，態度也很明確：這不是在否定OpenTelemetry的價值，是在劃清能力的邊界。

追蹤能暴露的：延遲尖峰、token用量異常、調用鏈路斷裂。這些都有用。

追蹤不能做的：在幻覺內容抵達用戶前攔截它；在事實性校驗失敗時自動重寫prompt；在推理賬單失控前熔斷；在有害輸出流出前阻斷而非僅僅記錄。

你仍然是那個修正層。凌晨兩點盯著Grafana的人，還是你。

監管級場景的真相：看得見，但修得慢

作者過去兩年在三個高度監管的領域搭建規模化AI系統：醫療收入周期管理、電網智能、基因組學流水線。這些不是實驗室環境。

他反復看到的模式：團隊在日志和追蹤上投入巨大，dashboard建得精美。但LLM在生產環境出問題時，修正流程仍是手動的、緩慢的、事故驅動的。

缺口不在"能不能看見"，而在"輸出層能否自主修正"。

沒人把這個做成產品。所以他做了。

ARGUS的架構：從"記錄異常"到"閉環修正"

ARGUS的核心設計分兩層。開源層是實時評估引擎，對LLM輸出做六維檢測：

針對智能體（agentic）系統，再疊加三個信號：

關鍵差異在閾值觸發后的行為。ARGUS不只做日志記錄，它啟動一個自主修正循環。

流程很直接：LLM調用 → ARGUS評估層 → 各維度通過/失敗判定 → 失敗則觸發修正循環（prompt重寫+重試）→ 修正后的輸出交付應用。

開源核心（argus-ai on PyPI）承擔可觀測層，自主修正循環作為專有層面向企業部署。

作者特意強調這不是要替代OpenTelemetry，而是互補："你可以把ARGUS的評估結果作為span導入OTel collector，基礎設施健康和輸出質量在同一trace里呈現。"

$41億收購背后的教訓

在R1 RCM期間，作者主導的工程工作最終貢獻了41億美元的收購估值。支撐這筆交易的AI系統處理了數百萬醫療理賠。

LLM出錯的代價不是"用戶體驗下降"，是真實的財務和合規風險。

那段經歷給他留下的印記：在高壓生產環境里，"看見問題"和"解決問題"之間的時間差，才是成本的核心來源。追蹤工具把這個時間差從"完全看不見"縮短到"幾分鐘內定位"，但剩下的手動干預環節，在規模化場景下依然致命。

ARGUS試圖吃掉的就是這段剩余時間。

項目剛開源不久，argus-ai的PyPI下載量和實際生產部署案例還在積累。作者放出的信號很明確：歡迎用OpenTelemetry繼續追蹤你的基礎設施，但別讓dashboard成為安慰劑——輸出層的自主修正，才是從"可觀測"到"可信賴"的最后一公里。

你的LLM pipeline里，從告警觸發到自動恢復，現在平均需要幾步人工介入？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

卡帕西都整破防了：AI Coding沒門檻，可部署環節真嗯啊的難

量子位 2026-03-27 12:12:46
0 跟貼 0
DeepSeek最會討好，LLM太懂人情世故了，超人類50%

機器之心Pro 2025-10-27 15:23:21
0 跟貼 0

業績猛漲背后，迅策科技正迎來重估時刻

華爾街見聞官方 2026-03-27 19:37:09
0 跟貼 0

2027年或迎AGI 1.0:人形機器人成本拐點將至、“圖靈測試”標準呼之欲出

每日經濟新聞 2026-03-28 17:15:04
0 跟貼 0
315曝光GEO投毒產業鏈？別慌！CMU首提無毒的合作式AutoGEO

新智元 2026-03-28 14:07:34
0 跟貼 0

美團的真正威脅藏在暗處

虎嗅APP 2026-03-28 17:15:03
0 跟貼 0

開源RL框架Verlog來了，專為LLM智能體打造，400回合不成問題

機器之心Pro 2025-10-08 15:52:12
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

以人為本的AI對用戶而言才是最有用的AI

每日經濟新聞 2026-03-14 13:16:04
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
「一人一天一部劇」時代降臨，但AI短劇供給過剩不是末日｜專訪巨日祿杰夫

36氪 2026-03-28 17:57:16
0 跟貼 0
企業軟件卡頓的5個元兇：第3個讓70%工程師踩過坑

我是一個養蝦人 2026-03-27 14:37:12
0 跟貼 0
沒文化真可怕，看似刪除操作，實則數據存取

墨林電影 2026-03-27 10:35:59
1 跟貼 1
霍爾木茲海峽"鎖死"全球能源五角大樓醞釀"致命一擊"

上游新聞 2026-03-27 22:22:04
8750 跟貼 8750
aiX-apply-4B逆襲DeepSeek-V3.2！aiXcoder發布代碼變更應用模型

機器之心Pro 2026-03-27 15:58:54
1 跟貼 1
伊朗窮打法擊潰以色列防線？無人機成本戰改寫中東規則

執筆寫思念 2026-03-28 03:14:31
0 跟貼 0
2萬打爆1.5億：美軍航母被拖進成本絞肉機

門前小溪下 2026-03-28 01:19:25
0 跟貼 0
真實體驗，15年油車用戶換電車，哪好哪差？

閆闖說車 2026-03-26 15:12:29
0 跟貼 0
烏克蘭從俄接收士兵遺體，俄烏間這驚人數據，烏是俄38倍還多

月亮姐侃生活 2026-03-26 09:01:40
1 跟貼 1
實拍2026 款仰望 U8：不只是閃充，用戶痛點全解決

鐘叔駕道 2026-03-28 18:01:32
1 跟貼 1
國外引進的機器，比魯智深還魯智深，效率比人工高出幾十倍！

霓裳愛說生活 2026-03-24 11:22:13
0 跟貼 0
廣州：下周一起，公立醫院掛號費調整

南方都市報 2026-03-28 11:52:00
584 跟貼 584
原來商場里瑞士卷，都是機器切割的，開始還以為人工操作！

歡樂二愣子俱樂部 2026-03-25 16:51:36
1 跟貼 1
第三輪第五批中央生態環保督察完成督察反饋

澎湃新聞 2026-03-27 22:09:14
355 跟貼 355
霍普金森桿上門服務

彡野于林 2026-03-27 13:43:17
0 跟貼 0
機械師的小技巧，塑料條就能測引擎間隙

科學大搜索 2026-03-27 22:12:41
18 跟貼 18
最新 | 天津供熱采暖收費新政發布

天津廣播 2026-03-27 21:48:34
564 跟貼 564
假山假景假臉!《白日提燈》爆火，打臉內娛多少流水線古裝劇!

徐徐道史 2026-03-28 12:50:45
1 跟貼 1
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1982 跟貼 1982
湖南一醫院被指診療不當致母子雙亡新進展：家屬拿到7萬元喪葬費

齊魯壹點 2026-03-27 21:40:15
1130 跟貼 1130
72小時，前衛防空導彈雙殺：2萬美元成本打下F-18，美軍痛心不已

軍武時間線 2026-03-28 15:53:11
1 跟貼 1
玩家都吵瘋了！PS5漲價下該沖Switch2還是Steam？

游民星空 2026-03-28 18:17:18
1 跟貼 1
于東來稱胖東來每個管理層每年都要接受員工無記名投票，得票低的將直接免職

封面新聞 2026-03-28 11:50:37
40 跟貼 40
汽車高速跑車，竟然人工散熱，這下這沒想到！

搞笑小輕輕 2026-03-28 13:16:23
1 跟貼 1
對委軍事行動贏了還是輸了？特朗普：賺了！

看看新聞Knews 2026-03-28 17:52:08
0 跟貼 0
美媒：中國成為全球動蕩期資金避風港

參考消息 2026-03-28 15:29:08
2 跟貼 2
伊朗MVP結算，這數據一出現，美國又要被打臉了

利利愛搞笑 2026-03-28 15:21:13
1 跟貼 1
出人命了，3名中國跨境賣家被起訴

派代 2026-03-28 18:24:49
0 跟貼 0
直播帶崗開進車間

中工網 2026-03-27 09:12:02
0 跟貼 0
兒童DHA品牌推薦，2026年新精選與科學選擇建議

影像渭南 2026-03-27 16:30:11
0 跟貼 0

手機 / 數碼

房產 / 家居

OpenTelemetry追了3年LLM，生產環境還是靠人工兜底

追蹤能告訴你"發生了什么"，但沒說"怎么修"

監管級場景的真相：看得見，但修得慢

ARGUS的架構：從"記錄異常"到"閉環修正"

$41億收購背后的教訓

遭中國學界"拉黑"后，這家AI頂會低頭道歉

特朗普：北約沒支持美打擊伊朗 美國以后也不會幫北約

特朗普：北約沒支持美打擊伊朗 美國以后也不會幫北約

“我是全家最差勁的運動員”

王一博改名上熱搜！個人時代正式開啟！

臥底"科技與狠活"培訓：化工調味劑泛濫

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

6.8萬方！天河員村再征地，金融城西區開發全面提速

AI+教師發展公益行暨第二屆全國“英語讀思言”及成果展評研討會在福建泉州成功舉辦

《紅色沙漠》組建貓咪軍團!愛貓人士游戲紀念逝去愛寵

在濰坊待了三天，沒遇到一個“濰坊人”

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

置換補貼價4.28萬起第五代宏光MINIEV正式上市