![]()
你正在車底擰螺絲,手機響了。爬出來?滿手油污。不接?又丟一單。Dane每周漏接幾百個電話,有時是450美元的剎車保養,有時是2000美元的發動機維修——錢就這么從指縫溜走。
他弟弟看不下去了。不是勸他雇前臺,而是直接寫了個AI接線員,取名Axle(車軸)。這名字夠冷,但功能更冷:它知道Dane的每一項報價、每一條規定,不會瞎編價格。
第一步:讓AI閉嘴,別瞎猜
raw LLM(原始大語言模型)在這里是顆雷。客戶問"剎車多少錢",它要是隨口說200美元,實際收費450美元,客戶到店直接翻臉。
解決方案是RAG(檢索增強生成):不給模型自由發揮的空間,只讓它從知識庫里找答案。
弟弟先爬了Dane的網站,把服務頁面、價格表全扒下來轉成markdown。整理成21份文檔:服務項目、定價、工期、營業時間、付款方式、取消政策、保修條款、代步車政策、專修車型——全部結構化。
接著用Voyage AI(voyage-3-large模型)把每份文檔轉成1024維向量。這些向量存進MongoDB Atlas,不是存關鍵詞,是存"意思"。客戶問"剎車多少錢",哪怕沒出現"剎車服務定價"這幾個字,系統也能通過語義相似度找到正確文檔。
查詢流程跑通:問題→向量化→Atlas向量搜索→返回最相關的3份文檔→塞進Claude(claude-sonnet-4-6)→生成回答。系統提示詞卡得很死:只準用知識庫內容,回答要短要口語,不知道就說不知道,留電話回頭打。
測試階段,終端輸入"機油保養多少錢",輸出:"常規45美元,全合成75美元,含機濾和液位檢查。"沒 hallucination(幻覺),沒廢話。
第二步:從文字到聲音,延遲必須低于2秒
文本對話搞定了,但接電話是另一回事。客戶不會等你打字,他們聽到的是聲音,而且耐心有限。
弟弟選了Pipecat框架處理實時語音流。架構變成:電話進來→語音轉文字(Deepgram)→走RAG流程拿答案→文字轉語音(Cartesia的Sonic模型)→播給客戶。全流程必須在2秒內完成,不然客戶以為斷線了。
這里有個細節:Cartesia的Sonic支持"語音克隆",但弟弟沒用Dane的聲音——太怪了,客戶知道是AI更踏實。選了預設的"專業友善男聲",語速比真人稍快,省時間。
延遲優化是硬骨頭。第一次端到端測試要4秒,客戶已經"喂?喂?"了。瓶頸在向量檢索環節,MongoDB Atlas的索引調了兩次,把top-k從5砍到3,夠準就行。最終穩定在1.8秒。
第三步:上線前的壓力測試
弟弟做了件狠事:自己打了50通測試電話,扮演各種難纏客戶。
場景一:故意問知識庫沒有的問題。"你們修特斯拉嗎?"Dane的店專做德系豪華車,特斯拉不在列表里。Axle回答:"我們專注奔馳、寶馬、奧迪、保時捷,特斯拉建議您聯系授權服務中心。需要我記錄您的電話,讓Dane推薦合作店鋪嗎?"沒瞎編,沒硬接。
場景二:打斷和追問。客戶聽到價格后追問"包含人工嗎?"Pipecat的打斷處理還算順滑,Axle能停住當前回答,重新檢索"剎車服務人工費"相關文檔,再組織語言。
場景三:背景噪音。弟弟故意在車間環境里打,有風炮聲、升降機響動。Deepgram的降噪模型過濾得干凈,但偶爾把"剎車片"聽成"剎車盤"——這種同音詞錯誤,靠RAG的語義檢索兜底,返回的文檔里兩者都有,Claude根據上下文判斷。
50通測試,準確率91%,3次聽錯關鍵詞,1次RAG retrieval(檢索)返回了不相關文檔導致報價偏差。弟弟把那次失敗案例喂給系統,調整了embedding的chunk size(分塊大小),從512 token改到256,粒度更細。
真實上崗第一周
3月15日,Axle正式接Dane的店電話。弟弟在后臺盯著實時日志,像看新生兒監護儀。
數據:7天接了147通電話,其中31通是詢價后成功預約,9通是Dane確實接不了的外地客戶(Axle禮貌拒絕并推薦同行),4通是AI沒答上來、留了電話等回撥。按平均客單價600美元算,這31單里哪怕只有一半真實成交,也是9300美元營收——而Dane之前每周漏接的電話,按他的估算,轉化率大概在15%到20%。
有個細節讓Dane意外。Axle接的一通電話里,客戶問"你們比4S店便宜多少?"這在知識庫里沒有直接答案,但RAG檢索到了"我們的定價策略"文檔,里面寫著"比經銷商平均低30%"。Claude組織成:"我們比4S店平均便宜30%,比如剎車保養,經銷商通常收650到800美元,我們是450美元。"客戶當場預約。
Dane自己沒這么利索的嘴皮子。他在車底修了三小時車,出來看到Axle的通話記錄,回了那4個未接的電話,成交了2單。
弟弟現在收到Dane的反饋:有客戶到店后問"剛才接電話那位在嗎?"Dane說"那是我弟寫的程序",客戶愣一下,然后笑說"比真人還清楚"。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.