![]()
新智元報(bào)道
編輯:好困 桃子
【新智元導(dǎo)讀】40克AI眼鏡變身Agent之眼,數(shù)字分身定制分身。當(dāng)Agent爬出屏幕走進(jìn)物理世界,這場(chǎng)關(guān)于生產(chǎn)力的降維打擊,真的不只是說(shuō)說(shuō)而已。
這幾個(gè)月,硅谷和中文AI圈都在流傳一個(gè)心照不宣的暗號(hào),「養(yǎng)龍蝦」。
一個(gè)Agent,7x24小時(shí)不睡覺,自主開瀏覽器、寫代碼、抓數(shù)據(jù)、交付成果……
![]()
這些「龍蝦」一度被視為未來(lái)的生產(chǎn)力神話,然而,它們所有的演進(jìn)路徑,都指向同一個(gè)終點(diǎn):
怎么在一塊屏幕里,把活干得更猛一點(diǎn)。
所謂的「AI員工」,本質(zhì)上是一個(gè)被釘死在屏幕背后的同事。下一代Agent,究竟該如何突破玻璃的束縛?
4月15日,廣交會(huì)開幕當(dāng)天,有人試著把這道坎跨過(guò)去。
一副40克的眼鏡;一顆裝進(jìn)機(jī)器人腦袋里的「超腦」;一個(gè)能跨設(shè)備接力干活的桌面搭子;再加上底層重新升級(jí)的AstronClaw平臺(tái),整套「Claw全家桶」一次性砸了下來(lái)。
![]()
佩戴訊飛AI眼鏡的多模交互場(chǎng)景
干這件事的是訊飛。
所有這些硬件、軟件、模型、平臺(tái)的更新,都指向了同一件事——
把Agent從屏幕里拽出來(lái),讓AI真正觸手可及!
這一次,「龍蝦」沖出了屏幕
要做到這一點(diǎn),第一步,是先給「龍蝦」一副能夠看見世界的身體。
硬件,才是Agent走出屏幕的第一道門。
訊飛AI眼鏡:Agent有了眼睛
訊飛翻譯硬件家族里最輕的那一塊,是一副眼鏡。
訊飛AI眼鏡整機(jī),僅40克。
作為全球最輕的雙目單色顯示多模態(tài)眼鏡,它比市面主流產(chǎn)品(50克以上)減重約20%。
重量只是入場(chǎng)券。訊飛AI眼鏡搭載的GlassClaw,才真正改變了Agent的輸入方式。
你看到什么,它就能識(shí)別和理解;你聽到什么語(yǔ)言,它就實(shí)時(shí)翻譯。
![]()
跨語(yǔ)言方面,中英首響快至2秒,AR翻譯目光鎖定2秒就能自動(dòng)出譯,加上18個(gè)離線語(yǔ)種,基本覆蓋了廣交會(huì)這種跨國(guó)采購(gòu)場(chǎng)景的剛需。
更硬的技術(shù)活,藏在降噪方案里。訊飛AI眼鏡首創(chuàng)了「唇動(dòng)識(shí)別」多模態(tài)降噪方案,靠5+1麥克風(fēng)陣列加骨傳導(dǎo),最遠(yuǎn)拾音距離8米。把聲源定位從「聽哪個(gè)方向」變成「看誰(shuí)的嘴在動(dòng)」。
發(fā)布會(huì)現(xiàn)場(chǎng),新華社記者徐弘毅戴上訊飛AI眼鏡,在科大訊飛展臺(tái)跑了一段相當(dāng)能打的實(shí)操。
展臺(tái)老師在講解訊飛AI翻譯耳機(jī)時(shí),訊飛AI眼鏡同時(shí)捕獲語(yǔ)音和圖像。多模態(tài)數(shù)據(jù)傳到AstronClaw,然后給徐弘毅補(bǔ)上了一段背景——
這款耳機(jī)是全球首款骨導(dǎo)加氣導(dǎo)的開放式專業(yè)翻譯耳機(jī)。
去年在上海和迪拜兩地同步發(fā)布,當(dāng)時(shí)還做了一場(chǎng)跨國(guó)翻譯電話演示。
![]()
最關(guān)鍵的環(huán)節(jié)在最后。徐弘毅扶了一下眼鏡,說(shuō)了一句話——
「根據(jù)我剛剛逛展的過(guò)程,生成相關(guān)素材發(fā)送到微信」。
GlassClaw把展區(qū)一路看到、聽到的內(nèi)容整理成圖文素材,發(fā)到了展臺(tái)工作人員的微信里。從看到、認(rèn)知、理解、思考到輸出,一口氣搞定全流程。
![]()
當(dāng)Agent的輸入從屏幕里的文字,變成眼前的真實(shí)世界,人機(jī)交互的范式就被重寫了。
Agent不再需要你一字一句地把世界描述給它聽,它自己就能看。
Claw直控機(jī)器人,送咖啡熱舞震撼
如果GlassClaw是Agent的眼睛,Claw就是Agent的神經(jīng)中樞。
主持人直接在AstronClaw下達(dá)一句指令:Guide 01,給我送杯咖啡。
![]()
然后,AstronClaw操控訊飛Guide 01機(jī)器人,提著咖啡慢慢走向臺(tái)前,遞給了主持人。
![]()
更驚艷的還在后頭。Guide 01把舞臺(tái)交給了它的「WallEX」和「小弟Nova」。
其中,WallEX是升級(jí)了Claw能力的智慧家居中控屏。Nova是配套氛圍燈,會(huì)根據(jù)場(chǎng)景自動(dòng)調(diào)色,主打家居里的浪漫氛圍。
現(xiàn)場(chǎng),機(jī)器人用一支舞,把這一組合的感染力瞬間拉滿。
![]()
這次Claw接入Guide 01,瞄準(zhǔn)的是機(jī)器人行業(yè)一個(gè)老大難:語(yǔ)音交互和動(dòng)作執(zhí)行嚴(yán)重割裂。
過(guò)去機(jī)器人聽懂一句話和做成一件事之間,隔著一層厚厚的代碼。
一句簡(jiǎn)單指令往往要被拆成一連串動(dòng)作,稍微復(fù)雜一點(diǎn)開發(fā)成本就指數(shù)級(jí)往上竄。
Claw打通了這一層。
它把AstronClaw的任務(wù)編排能力、訊飛機(jī)器人超腦平臺(tái)、星火大模型、多模態(tài)交互技術(shù)深度融合,跑出的是一條完整鏈路:
自然交互理解 → 多傳感器融合 → 自主任務(wù)規(guī)劃 → 物理端執(zhí)行
通過(guò)「軟硬一體」模組的形式,任何機(jī)器人廠商都可以快速集成。
這等于給整個(gè)行業(yè)交了一份標(biāo)準(zhǔn)答案。機(jī)器人廠商不用再自己啃Agent這塊骨頭,Claw就是一個(gè)即插即用的Agent大腦模塊。
家居場(chǎng)景的智能終端怎么接進(jìn)Agent生態(tài),訊飛給的答案和機(jī)器人是同一個(gè),都接進(jìn)同一套任務(wù)編排和上下文里。
「眼睛」和「手腳」都有了,Agent已經(jīng)能看、能動(dòng)。
但真正要把活干完、干好,還得有一套能把任務(wù)串起來(lái)、記得住上下文的軟件中樞。
它叫AstronClaw。
聊天框裝不下的活,AstronClaw接住了
過(guò)去的AstronClaw更像一個(gè)能干的網(wǎng)頁(yè)助手,在瀏覽器里派活,云端把活干完。
這套「養(yǎng)龍蝦」模式3月上線之后迅速跑通。訂閱從16.8元/月起步,企業(yè)級(jí)Agent的門檻被壓到了一杯咖啡錢。
這里順帶說(shuō)一件事。開篇提到的那個(gè)OpenClaw,中國(guó)信通院4月剛出了一份《OpenClaw類智能體部署風(fēng)險(xiǎn)管理指南》。行業(yè)開始給「養(yǎng)龍蝦」這件事劃安全底線了。
最重要的是,科大訊飛成為首批通過(guò)自檢的廠商之一。
這在一定程度上證明了AstronClaw在安全架構(gòu)、任務(wù)執(zhí)行隔離、數(shù)據(jù)處理規(guī)范等方面,已經(jīng)具備了進(jìn)入企業(yè)核心場(chǎng)景的能力。
不過(guò),聊天框有聊天框的天花板。
一個(gè)任務(wù)從手機(jī)切到電腦再切到會(huì)議室,Agent就斷片,每次交互都是一次重新開始。這是所有對(duì)話界面智能體繞不開的坎。
這一次,AstronClaw的升級(jí),直接動(dòng)了底層架構(gòu)。
第一刀砍在端云協(xié)同。
復(fù)雜任務(wù)不再綁在單一設(shè)備上,云端負(fù)責(zé)思考和規(guī)劃,終端負(fù)責(zé)現(xiàn)場(chǎng)執(zhí)行。
一個(gè)任務(wù)從辦公本發(fā)起,可以在手機(jī)上繼續(xù)推進(jìn),再推到電腦收尾,換設(shè)備不斷片。
第二刀砍在跨端記憶同步。
Agent記得自己走到了哪一步,也記得你上次提過(guò)什么要求。
用訊飛自己的話說(shuō),這是「像接力賽一樣持續(xù)推進(jìn)」。Agent從一次性聊天,變成了一條不會(huì)斷的任務(wù)流。
還有一刀砍在生態(tài)接口。
硬件連接協(xié)議這次一起開放,不同類型的智能設(shè)備都能快速接入AstronClaw。前面那只機(jī)器人和那副眼鏡,背后跑的就是這套協(xié)議。
目前,訊飛把第一臺(tái)跨設(shè)備接力的Agent裝在自家辦公本X5上。
發(fā)布會(huì)上,主持人對(duì)辦公本說(shuō)一句話,剛才在AstronClaw云端生成的逛展攻略和個(gè)人行程就同步了過(guò)來(lái)。
![]()
Loomy:上傳一張照片,造一個(gè)數(shù)字分身
AstronClaw是云端那只龍蝦,Loomy是鉆進(jìn)你電腦里的那只。
3月發(fā)布的Loomy已經(jīng)跑通了基本能力。目錄級(jí)隔離讓AI不越雷池半步。
QQ、飛書、釘釘、微信四大IM接入,手機(jī)就是遠(yuǎn)程控制臺(tái),首發(fā)期贈(zèng)送積分,新用戶無(wú)門檻就能上手。
![]()
這一次的升級(jí),Loomy要從桌面工具變成長(zhǎng)期協(xié)作伙伴。
會(huì)議中自動(dòng)整理紀(jì)要、安排日程、跟進(jìn)任務(wù)進(jìn)度這些事,從「你得打開軟件操作」變成了「你開口它去做」。
更有趣的,是這次新加的Buddy。
只需上傳一張照片,加一段極具個(gè)人性格特色、工作風(fēng)格的文本描述,就能量身定制一個(gè)外貌、風(fēng)格相似的數(shù)字分身。
它可以成為你的「工作搭子」,更懂你自己,并處理一系列工作任務(wù)。
這不,現(xiàn)場(chǎng)主持人萬(wàn)里懟臉演示「萬(wàn)里L(fēng)oomy」全程搭建過(guò)程,她把自己平時(shí)一些特點(diǎn)扔給Loomy:
喜歡回復(fù)111、不喜歡拖拉、做事責(zé)任感強(qiáng)、容易焦慮憤怒
它會(huì)調(diào)用soul-creator技能,把萬(wàn)里的說(shuō)話風(fēng)格、特點(diǎn)、價(jià)值觀寫入soul檔案中,最終生成一個(gè)萬(wàn)里L(fēng)oomy。
![]()
接下來(lái)萬(wàn)里現(xiàn)場(chǎng)出了個(gè)考題:「領(lǐng)導(dǎo)開會(huì)三四十分鐘還沒進(jìn)入正題,怎么打斷?」萬(wàn)里L(fēng)oomy一口氣給了五個(gè)高情商方法,最后一條是「實(shí)在不行就忍」。另一位主持人馬高聽完插了一句「咱倆共用一個(gè)老板」,全場(chǎng)笑場(chǎng)。
這就是Buddy「懂你」的真實(shí)樣子,它給你的不是一個(gè)標(biāo)準(zhǔn)答案,是一個(gè)像你自己會(huì)寫的答案。
![]()
![]()
而且,在Loomy中可以創(chuàng)建多個(gè)Buddy,處理各種各樣的工作任務(wù)。
比如,訊飛劉慶峰董事長(zhǎng)沒來(lái)現(xiàn)場(chǎng),讓已創(chuàng)建好的劉總Buddy,以其風(fēng)格生成一段40s發(fā)言,給現(xiàn)場(chǎng)打打氣。
這種真實(shí)感,只能用「震撼」形容。不僅聲音像素級(jí)還原,竟連演講中標(biāo)志性語(yǔ)調(diào)、鼓舞風(fēng)格都與劉慶峰本人如出一轍。
合成語(yǔ)音里那句「用人工智能建設(shè)美好世界的使命」,全場(chǎng)靜了幾秒。
有了Loomy數(shù)字分身,真正的需求還是讓它去完成手里的案頭工作,比如PPT、視頻、宣傳文案。
現(xiàn)場(chǎng),萬(wàn)里L(fēng)oomy一口氣調(diào)用了三個(gè)原生Skill,把廣交會(huì)的案頭活全清了——
智文Skill寫了一份廣交會(huì)復(fù)盤PPT。據(jù)現(xiàn)場(chǎng)介紹,智文Skill的原生應(yīng)用已經(jīng)突破1000萬(wàn)用戶。
智作Skill做了一條圍繞訊飛AI眼鏡的宣傳視頻,用的是萬(wàn)里自己的數(shù)字分身做出鏡。
繪文Skill寫了一篇廣交會(huì)的報(bào)道文章,并在兩個(gè)第三方自媒體平臺(tái)預(yù)發(fā)布等待審核。
可以看到,以上這些都是「通用型」案頭任務(wù)。在廣交會(huì)上,最典型的還是采買任務(wù)。
招采Claw抓出圍串標(biāo),陪練AI賽博實(shí)戰(zhàn)
別急,這里就輪到企業(yè)級(jí)智能體出場(chǎng)了。
最重要的「招采Claw」,深度融合了AstronClaw、SkillHub和招采知識(shí)庫(kù)的招采助手。
發(fā)布會(huì)上,主持人把整套招采文件一口氣全部上傳,招采Claw自動(dòng)調(diào)用文件解析Skill。
它先把復(fù)雜標(biāo)書規(guī)整化處理,方便后面定位每一處細(xì)節(jié)。然后像專家一樣,開始檢測(cè)圍串標(biāo)風(fēng)險(xiǎn)。很快抓出兩家公司的標(biāo)書里用了同一張圖片,判定為圍串標(biāo),取消兩家資格。
![]()
![]()
![]()
接下來(lái)是資質(zhì)評(píng)審。招采Claw發(fā)現(xiàn)一家公司的工程資質(zhì)是乙級(jí),但招標(biāo)文件明確要求甲級(jí),排除。
最后兩步,是初評(píng)和復(fù)審。招采Claw這里沒有派單個(gè)Agent上場(chǎng),而是拉起了一個(gè)Agent Team。
每家入圍企業(yè)分配一個(gè)子Agent專門跟進(jìn),主Agent負(fù)責(zé)統(tǒng)籌。復(fù)審環(huán)節(jié)再細(xì)分。
業(yè)績(jī)?cè)u(píng)審、施工組織、項(xiàng)目團(tuán)隊(duì)、環(huán)境保護(hù)各派一個(gè)專精Agent,互不干擾、并行推進(jìn),最后由主Agent合稿出報(bào)告。
![]()
可不要小瞧這一過(guò)程。發(fā)現(xiàn)相似圖表、資質(zhì)不合格等細(xì)節(jié),以往要耗費(fèi)多位專家時(shí)間和精力。招采Claw把專家從繁瑣活里解放出來(lái),時(shí)間花在決策、談判、把控風(fēng)險(xiǎn)上,效率成倍提升。
這是Agent Team多智能體協(xié)同第一次跑在一個(gè)真實(shí)的企業(yè)級(jí)場(chǎng)景里,也是這次發(fā)布會(huì)最炸的賣點(diǎn)之一。
職場(chǎng)中,通常對(duì)打工提出了更高的要求:深諳行業(yè)各種know-how,成為多技能人才。
這不,陪練skill,企業(yè)員工專業(yè)培訓(xùn)的「賽博老師」能救你。
它調(diào)用了「星火陪練」的技能,與Claw一起生成一個(gè)真實(shí)的模擬場(chǎng)景。
主持人在「招采討價(jià)還價(jià)」的模擬里挑了個(gè)獨(dú)家供應(yīng)商「何總」,十幾年經(jīng)驗(yàn),一上來(lái)就咄咄逼人。
![]()
兩輪交鋒下來(lái),最終以8%讓價(jià)、60天賬期、合同寫最低采購(gòu)量收尾,AI給的成績(jī)是90分。
![]()
評(píng)審報(bào)告還按節(jié)奏掌控力、風(fēng)格控制力等維度給出了詳細(xì)分析。
![]()
招采陪練做的是新人訓(xùn)練。AI模擬供應(yīng)商和采購(gòu)員對(duì)話,把幾個(gè)月實(shí)戰(zhàn)壓縮成幾十輪對(duì)話。
SkillHub:企業(yè)技能的「軍火庫(kù)」
以上提到的陪練Skill,這么多訊飛Skill可以在哪里用得上?
它們?nèi)慷挤旁诹思寄軅}(cāng)庫(kù)—— Astron SkillHub中。它是管理AI技能的「企業(yè)版NPM」,國(guó)內(nèi)首個(gè)企業(yè)級(jí)自托管的開源技能平臺(tái)。
![]()
技能、數(shù)據(jù)、日志都留在企業(yè)自有環(huán)境里,數(shù)據(jù)主權(quán)完全在自己手里。
企業(yè)里真正值錢的東西,往往是資深員工踩過(guò)坑沉淀下來(lái)的prompt、腳本文件以及工作流。
這些東西過(guò)去散落在聊天記錄、筆記和模板文件里,人一走,流程也跟著走。
SkillHub做的就是把這類工作流打包成版本化、權(quán)限化、可審計(jì)的技能,存進(jìn)公司的私有倉(cāng)庫(kù)。
新員工一個(gè)命令就能調(diào)用。
到現(xiàn)在,SkillHub上的開源Skill已經(jīng)超過(guò)3000個(gè),由海內(nèi)外開發(fā)者共同維護(hù)。
生態(tài)兼容性上,SkillHub完全兼容ClawHub CLI協(xié)議。一次發(fā)布,AstronClaw、OpenClaw、Loomy都能一鍵下載、安裝和調(diào)用。
到這里,「Claw全家桶」的全貌已經(jīng)擺出來(lái)了——
GlassClaw在物理世界負(fù)責(zé)感知和執(zhí)行,WallEX覆蓋家居場(chǎng)景; AstronClaw在云端調(diào)度任務(wù),Loomy在桌面當(dāng)協(xié)作伙伴和數(shù)字分身,SkillHub把企業(yè)的技能資產(chǎn)沉淀下來(lái)。
市面上,幾乎所有廠商都在說(shuō)自己軟硬一體,但真能做到的沒幾家。
原因很簡(jiǎn)單,「堆料」不難,難的是往下打得穿。
訊飛的差異化不是「做得全」,是「每一層都是自己的」。
從自研大模型、自建平臺(tái)、自造硬件、自養(yǎng)開發(fā)者生態(tài),這四件事但凡缺一件,這根主干就斷了。
眼睛看到的、手腳執(zhí)行的、桌面協(xié)作的、企業(yè)沉淀的,最后都要匯到同一個(gè)大腦里。
而能不能匯得通,答案全在底座。
標(biāo)王連莊,靠的是十六年家底
說(shuō)了這么多,最終所有的線索都指向了一個(gè)必須回答的問(wèn)題:憑什么是訊飛?
先上數(shù)據(jù)。2025年全年,訊飛拿到了210個(gè)中標(biāo)項(xiàng)目,23.16億中標(biāo)金額。數(shù)量和金額兩項(xiàng)都是第一,蟬聯(lián)2025年大模型「標(biāo)王」。
也就是說(shuō),訊飛一家的中標(biāo)金額,大幅超過(guò)了榜單上后面幾家披露金額的總和。
更關(guān)鍵的是分布。教育、醫(yī)療、金融、通信、能源、政務(wù)六大行業(yè)全線覆蓋,80%以上是應(yīng)用類項(xiàng)目,真正落地到了企業(yè)業(yè)務(wù)流。
數(shù)字背后是具體的項(xiàng)目。
訊飛拿下了安徽省人工智能應(yīng)用中試基地,深耕醫(yī)學(xué)垂類模型,承擔(dān)全省試點(diǎn)的那一環(huán)。
國(guó)家能源集團(tuán)用「OCR+星火大模型」打造智能無(wú)人評(píng)審系統(tǒng),率先在非招采購(gòu)全類別、全方式的業(yè)務(wù)跑通。
西安鐵路通過(guò)星火知識(shí)庫(kù)與訊飛智文,將大模型能力平替進(jìn)大基建基層的日常辦公流。
尤其要拎出來(lái)說(shuō)的是美團(tuán)。基于星火大模型的AI文案和AI腳本,已經(jīng)在旗下多個(gè)產(chǎn)品上線。這一條的分量不在于單子大小,在于客戶是誰(shuí)。一線C端互聯(lián)網(wǎng)大廠接入訊飛的大模型底層,是客戶光譜里的新面孔。
而所有這些項(xiàng)目背后,是一個(gè)從2010年長(zhǎng)起來(lái)的開放平臺(tái)。
截至2026年3月31日,訊飛開放平臺(tái)已經(jīng)沉淀1074萬(wàn)開發(fā)者團(tuán)隊(duì)、931項(xiàng)AI產(chǎn)品、403萬(wàn)應(yīng)用、43.1億臺(tái)終端設(shè)備。十六年家底。光星火發(fā)布以來(lái)就新增664萬(wàn)開發(fā)者,大模型相關(guān)開發(fā)者253萬(wàn)。
能做Agent生態(tài)整合的公司不止一家。但能把生態(tài)、模型、硬件、落地經(jīng)驗(yàn)全部湊齊的,沒幾家。
當(dāng)龍蝦走出聊天框
當(dāng)Agent有了眼睛、耳朵和手,它要解決的問(wèn)題就變了。不再是「如何回答得更聰明」。是「如何把事情真的做完」。
一年前,AI圈剛開始流行養(yǎng)龍蝦的時(shí)候,沒人說(shuō)過(guò)龍蝦有一天會(huì)爬出魚缸。
現(xiàn)在它爬出來(lái)了。
下一個(gè)問(wèn)題不再是它能不能替人干活。是它走到哪家工廠、哪個(gè)會(huì)議室、哪個(gè)展臺(tái),就會(huì)先改變哪里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.