![]()
3月31日,在第27屆ITES深圳工業(yè)展暨"具身覺醒,智造躍遷"峰會(huì)現(xiàn)場,鈦媒體聯(lián)合ITES深圳工業(yè)展、工創(chuàng)聯(lián),邀請到臨界點(diǎn)AGILINK市場總監(jiān)韓曉璇、帕西尼感知科技區(qū)域負(fù)責(zé)人李星,與主持人李非凡展開了一場關(guān)于"物理AI"落地的深度對話。
這場對話跳出技術(shù)愿景的空談,聚焦具身智能從0到1的產(chǎn)業(yè)落地痛點(diǎn),兩位深耕產(chǎn)業(yè)鏈的從業(yè)者坦誠分享一線實(shí)踐經(jīng)驗(yàn),既拆解了當(dāng)前產(chǎn)業(yè)發(fā)展的核心困境,也明確了落地路徑與未來趨勢。對話核心圍繞具身智能技術(shù)突破、成本控制、場景落地、人機(jī)協(xié)作四大維度展開,兩位嘉賓結(jié)合自身企業(yè)實(shí)踐,全方位解讀了產(chǎn)業(yè)發(fā)展現(xiàn)狀與未來可能。
談及具身智能落地的核心困境,兩位嘉賓達(dá)成共識(shí),當(dāng)前產(chǎn)業(yè)最大的難題在于大腦層(決策層)、執(zhí)行層、數(shù)據(jù)層難以形成閉環(huán),行業(yè)標(biāo)準(zhǔn)缺失導(dǎo)致技術(shù)路線"百家爭鳴"、適配成本高企。即便觸覺傳感器已實(shí)現(xiàn)從萬元級(jí)到百元級(jí)的成本突破,多數(shù)場景的ROI仍難算平賬。更關(guān)鍵的是,工業(yè)場景的VLA與消費(fèi)級(jí)Demo完全是"兩碼事”,前者的核心追求是良品率與一次直通率,而非無邊界的泛化能力。
與此同時(shí),兩位嘉賓也分享了各自企業(yè)的突破:臨界點(diǎn)是智元旗下專注靈巧操作的核心子公司,憑借全鏈條自研能力深度融合智元具身智能生態(tài),現(xiàn)已實(shí)現(xiàn)靈巧手規(guī)模化量產(chǎn),單月交付2000臺(tái),創(chuàng)行業(yè)紀(jì)錄。帕西尼則完成超十億B輪融資、估值破百億,自研六維力傳感器打破國外壟斷,構(gòu)建了從傳感器到人形機(jī)器人的全鏈路布局。
當(dāng)被問及人機(jī)協(xié)作的終極形態(tài),韓曉璇用"養(yǎng)兒防老"的生動(dòng)隱喻點(diǎn)透核心邏輯:"人和具身智能機(jī)器人的關(guān)系,就像一個(gè)成年人養(yǎng)育一個(gè)小孩,初期投入很多養(yǎng)育成本,等他成長起來就能給你提供價(jià)值。"
李星則認(rèn)為:"人不會(huì)被AI替代,但會(huì)被掌握AI的人淘汰",并明確指出,現(xiàn)階段機(jī)器人的核心任務(wù)是先把老師傅的SOP學(xué)明白,而工人的角色將從"操作者"向"定義者"和"決策者"轉(zhuǎn)型。
此外,對話還明確了場景落地的核心方向:靈巧手已在高壓帶電巡檢等特種作業(yè)場景實(shí)現(xiàn)商業(yè)閉環(huán),未來將向精密制造、物流分揀等領(lǐng)域拓展;成本控制上,帕西尼計(jì)劃通過拓展消費(fèi)電子賽道進(jìn)一步攤薄傳感器成本,臨界點(diǎn)則將依托上游硬件降本優(yōu)化產(chǎn)品結(jié)構(gòu)。
這場對話沒有承諾觸手可及的產(chǎn)業(yè)爆發(fā),卻道出了物理AI落地最誠實(shí)的現(xiàn)狀:大部分場景仍算不平賬,但隨著核心硬件持續(xù)降本、人力成本不斷升高,一升一降之間,具身智能的商業(yè)化空間正在逐步打開。
同時(shí),2026年作為具身智能數(shù)據(jù)元年,海量真實(shí)工業(yè)數(shù)據(jù)的采集與訓(xùn)練,以及行業(yè)標(biāo)準(zhǔn)的逐步完善,將成為推動(dòng)產(chǎn)業(yè)規(guī)模化發(fā)展的關(guān)鍵力量。
以下是本次對話內(nèi)容實(shí)錄,略經(jīng)編輯:
李非凡: 各位直播間前的觀眾朋友們大家好,非常歡迎大家!今天上午我們看到由鈦媒體、ITES深圳工業(yè)展以及工創(chuàng)聯(lián)合帶來的直播節(jié)目。我們今天的直播主題正如背景板上寫的:"物理AI現(xiàn)場"。今天非常高興邀請到兩位嘉賓,和我一起探討,在這個(gè)時(shí)代,如何在垂直場景中實(shí)現(xiàn)AI應(yīng)用。
過去一年,大模型已經(jīng)有了基本的行業(yè)規(guī)則和架構(gòu)。那么,如何讓大模型更好地應(yīng)用在工業(yè)生產(chǎn)環(huán)境中?也就是我們常說的具身智能,如何讓AI更好地觸摸現(xiàn)實(shí)場景和環(huán)境?
從今天開始,我們兩天時(shí)間將和大家一起分享,在產(chǎn)業(yè)端如何思考從零到一的問題。以前我們談了很多AI的愿景,今天更多落實(shí)在產(chǎn)業(yè)落地的從零到一,思考我們帶來的問題和如何解決麻煩。
今天的兩位嘉賓是:臨界點(diǎn)AGILINK市場總監(jiān)韓曉璇女士,以及帕西尼感知科技區(qū)域負(fù)責(zé)人李星先生。首先請各位分享一下各自企業(yè)的業(yè)務(wù)、優(yōu)勢和特點(diǎn)。
韓曉璇: 大家好,我是來自臨界點(diǎn)的韓曉璇。我們臨界點(diǎn)是一家專注于機(jī)器人靈巧操作的全球化科技公司。我們圍繞機(jī)器人的感知、控制、執(zhí)行和數(shù)據(jù)的鏈路,打造了以機(jī)器人五指靈巧手和工業(yè)級(jí)自適應(yīng)夾爪為核心的產(chǎn)品,還包括開放式的具身智能數(shù)據(jù)采集裝置以及完整的解決方案。我們是國內(nèi)首批實(shí)現(xiàn)靈巧手量產(chǎn)和交付的企業(yè)之一。
李星:各位老師、同行大家好,我是帕西尼感知科技的李星。今天主要圍繞具身智能落地的實(shí)際難題,和大家做務(wù)實(shí)的交流。帕西尼專注觸覺感知,解決機(jī)器人"看得見、摸不準(zhǔn)、拿不穩(wěn)"的問題。我們給AI裝上能感知真實(shí)場景的指尖,提供整體解決方案。核心團(tuán)隊(duì)來自全球首個(gè)人形機(jī)器人誕生地——早稻田大學(xué)機(jī)器人實(shí)驗(yàn)室。我們圍繞具身感知硬件-具身全模態(tài)實(shí)采數(shù)據(jù)-具身智能模型形成了全棧創(chuàng)新能力,是業(yè)內(nèi)少有的全棧型企業(yè)。
公司最新情況是剛完成超十億的B輪融資,估值破百億,是國內(nèi)八大估值破百億的具身智能企業(yè)之一。目前公司重點(diǎn)在硬件產(chǎn)品迭代優(yōu)化、數(shù)據(jù)工廠擴(kuò)產(chǎn),以及全模態(tài)(含觸覺)具身智能大模型的迭代優(yōu)化。我們的優(yōu)勢:一是技術(shù)壁壘突出,擁有自研的霍爾陣列式多維觸覺傳感器,最新一代GEN3多維觸覺傳感器于去年8月發(fā)布,達(dá)到每秒采集百萬次、多達(dá)15種觸覺信息的全新突破,性能再度突破世界巔峰,與此同時(shí),其價(jià)格最低僅有199元,以卓越性價(jià)比牢牢掌握高精度觸覺傳感器的定義權(quán);二是我們擁有業(yè)內(nèi)規(guī)模最大、模態(tài)最全的全模態(tài)具身智能實(shí)采數(shù)據(jù),以百億級(jí)產(chǎn)能進(jìn)一步夯實(shí)在具身數(shù)據(jù)領(lǐng)域的領(lǐng)先優(yōu)勢;三是率先打造了基于觸覺、視覺、動(dòng)作、語音的OmniVTLA模型,并以百億級(jí)具身數(shù)據(jù)為訓(xùn)練語料,加速迭代場景泛化能力;最后,我們在商業(yè)化應(yīng)用方面位居業(yè)內(nèi)領(lǐng)先地位,傳感器、靈巧手、人形機(jī)器人全鏈路產(chǎn)品矩陣已在工業(yè)制造、精密場景中批量化應(yīng)用,有大規(guī)模交付、跨區(qū)域響應(yīng)的豐富經(jīng)驗(yàn)。
李非凡: 從AI的算法、算力到接觸現(xiàn)實(shí)世界的觸感,你們覺得從零到一最大的跨越難點(diǎn)是什么?
韓曉璇: 我覺得難點(diǎn)在于大腦層(決策層)、執(zhí)行層以及數(shù)據(jù)層目前很難閉環(huán)。從靈巧手出發(fā),就像李星總提到的,很難抓得準(zhǔn),觸覺感知存在技術(shù)難度。我們在抓取和操作的算法、數(shù)據(jù)收集上,也很難做到多維度、標(biāo)準(zhǔn)化的鏈路收集。人手上感知器非常多,人具備決策靈活性,操作時(shí)會(huì)自動(dòng)克服環(huán)境變化、溫濕度、摩擦力等問題。但機(jī)器層面,很難在完整決策鏈路上快速達(dá)到自主決策。另外,整個(gè)行業(yè)對數(shù)據(jù)采集還沒有完全標(biāo)準(zhǔn)化的流程和體系。
李非凡: 您覺得標(biāo)準(zhǔn)化流程大概需要多長時(shí)間?
韓曉璇: 會(huì)有一定時(shí)間。首先,大家的接口不一致。比如靈巧手的數(shù)據(jù)接口、機(jī)械接口很難統(tǒng)一,行業(yè)還在百家爭鳴、技術(shù)路線未收斂的階段。有人做開源方案,有人做高端科研方案。對終端用戶或集成商來說,適配不同類型的手和機(jī)器人已經(jīng)是很大的工作量。再往下一層,通訊協(xié)議也不同,即使都支持ROS框架,在原子技能或原動(dòng)作層面,參數(shù)定義差距也很大。目前我們還處于比較初期的階段。
李非凡: 李總怎么看這個(gè)趨勢和進(jìn)程?
李星:我們自研的觸覺傳感器,第三代單價(jià)已經(jīng)做到百元級(jí)別,相比上一代大幅降低,現(xiàn)在最低價(jià)格已經(jīng)到200元以以內(nèi)。早期國產(chǎn)觸覺傳感器產(chǎn)品沒起來時(shí),進(jìn)口一片要上萬美金,經(jīng)過我們的創(chuàng)新迭代,全行業(yè)終于迎來了用得起、用得好的高性能觸覺傳感器。
李非凡: 標(biāo)準(zhǔn)化更多是為了投放市場時(shí),像流水線一樣降本增效、實(shí)現(xiàn)工業(yè)化規(guī)模化。那么,在靈巧手和具身智能行業(yè),要進(jìn)入家庭或苛刻的工業(yè)環(huán)境,成本和壽命的現(xiàn)狀如何?
李星:我們自研的觸覺傳感器,第三代單價(jià)已經(jīng)做到百元級(jí)別,相比上一代降本99%以上。我們的觸覺傳感器基于6D霍爾方案。早期國產(chǎn)產(chǎn)品沒起來時(shí),進(jìn)口一片要上萬美金。到我們第一、二代也得大幾千人民幣。第三代我們?yōu)榱四茏屝袠I(yè)用得起、用得好,成本降到了上一代的99%以上,現(xiàn)在最低價(jià)格已經(jīng)到200元以內(nèi)。同時(shí)性能也有提升。
李非凡: 工業(yè)場景下,耐磨和壽命怎么樣?
李星: 第三代觸覺傳感器使用壽命達(dá)到工業(yè)級(jí)的1000萬次,完全滿足需求。而且耐高溫、耐磨、抗穿刺,甚至外部輕微破壞也能正常使用。這是我們技術(shù)路線的優(yōu)越性。
李非凡: 下一代在成本、壽命、技術(shù)路徑上有什么規(guī)劃?
李星: 我們也在瞄準(zhǔn)除了具身智能以外的賽道,比如消費(fèi)級(jí)電子產(chǎn)品,希望讓傳感器進(jìn)入這些領(lǐng)域,通過市場規(guī)模進(jìn)一步降本。
李非凡:行業(yè)內(nèi)提到了VLA,多模態(tài)整合。大家都在追求確定性和良品率,這是商業(yè)化的必由之路。從市場角度看,工業(yè)客戶真的需要一個(gè)像ChatGPT一樣陪聊天的機(jī)器人嗎?會(huì)不會(huì)為了追求通用性反而犧牲了專注度和性價(jià)比?
韓曉璇: 工業(yè)場景里的VLA大模型,跟普通老百姓看到的展示類demo背后的VLA是兩碼事。無邊界VLA強(qiáng)調(diào)泛化能力,場景生活化、任務(wù)長時(shí)序、自主操作。但工業(yè)場景的VLA還是VLA技術(shù)路線,卻是為特定場景做了定制化訓(xùn)練的模型。工業(yè)里大家追求的是生產(chǎn)力,以最可控的工程化成本追求最大化的生產(chǎn)價(jià)值。核心目標(biāo)是良品率或一次直通率。我們在工業(yè)里做VLA,是為了在同一個(gè)工藝域內(nèi)做一定程度的泛化,從而在最短時(shí)間內(nèi)實(shí)現(xiàn)規(guī)模化部署。
李非凡: 這半年靈巧手行業(yè)備受資本和媒體追捧。從行業(yè)外看,大家覺得靈巧手可能更多用在流水線上的標(biāo)準(zhǔn)化工作。在你們看來,靈巧手的未來或正在挖掘的市場需求和場景會(huì)在哪些板塊?
李星:目前靈巧手應(yīng)用在真實(shí)的工廠精密制造、醫(yī)療行業(yè)等。最主要不是代替人,而是完成高強(qiáng)度或有一定危險(xiǎn)的工作。人可以去做創(chuàng)新、研發(fā)、編程等更有價(jià)值的事,讓機(jī)器人去做高強(qiáng)度、高重復(fù)性、標(biāo)準(zhǔn)化工序的工作。
韓曉璇:在剛需或特種作業(yè)場景下,目前能實(shí)現(xiàn)商業(yè)閉環(huán)。比如高壓帶電巡檢,以前用固定底座加夾爪實(shí)現(xiàn)開關(guān)電表箱、開門等。現(xiàn)在底座可以移動(dòng)(四足狗或底盤),夾爪換成靈巧手后能實(shí)現(xiàn)更多動(dòng)作。另外,我們在一個(gè)工藝域內(nèi)做泛化,把工藝分類。比如堆碼垛、拆碼垛,來料一致性好的規(guī)整包裝,已有成熟方案。現(xiàn)在拓展到更高難度場景,比如紙盒因溫濕度變軟,或里面是食物不能擠壓,傳統(tǒng)夾爪就不適用了,我們考慮用手來做。如果能跑通最小閉環(huán),就能伴隨上游降本實(shí)現(xiàn)更大規(guī)模化。
李非凡: 客戶會(huì)直接想"能代替幾個(gè)人",然后計(jì)算算力、云計(jì)算、服務(wù)器、維護(hù)、培訓(xùn)等成本。加上隱性成本后,還有性價(jià)比嗎?
韓曉璇: 目前從ROI角度看,大部分場景算不平賬。特定場景的商業(yè)化閉環(huán)可以,但通用化的綜合工業(yè)裝配或上下料場景還不行。不過我覺得很快了,今年之內(nèi),像李總這樣的公司降本后,我們的成本也會(huì)逐步下降。另外人力成本在升高,一升一降之間空間會(huì)很大。
李非凡: 李總,下一代怎么進(jìn)一步降本增效?
李星: 這是雞生蛋蛋生雞的問題。我們上游和下游合作伙伴的批量化,以及更多場景化需求做POC,都會(huì)涉及大量開發(fā)成本。短期內(nèi)很難真正把成本降下來。但隨著技術(shù)發(fā)展、上游核心零部件降本、大規(guī)模制造業(yè)的市場化機(jī)制,未來機(jī)器人進(jìn)入工廠和千家萬戶時(shí),價(jià)格一定能做到非常低,這得益于中國強(qiáng)大的制造業(yè)供應(yīng)鏈。我們也在探索有量的場景,比如物流分揀,和頭部物流、電商平臺(tái)有合作;汽車、3C、家電等制造業(yè)也在做POC項(xiàng)目。相信不久將來成本能降下來。
李非凡: 你們心目中真正的人機(jī)協(xié)作,是讓機(jī)器學(xué)習(xí)人,還是讓人適應(yīng)機(jī)器?
我覺得更應(yīng)學(xué)習(xí)場景本身。在具體場景中,如果做流水線硬件輔助,機(jī)器有自己原生的想法和調(diào)用工具的方式可能更適合AI指數(shù)級(jí)迭代。完全適應(yīng)人只是機(jī)械化代替,沒有釋放AI的增長力和想象力。從二位垂直商業(yè)場景看,人機(jī)協(xié)作應(yīng)該走哪條路徑?
韓曉璇: 你看得比較遠(yuǎn)。工業(yè)場景是高標(biāo)準(zhǔn)的,目前工業(yè)具身能把現(xiàn)有的SOP學(xué)明白就不錯(cuò)了。首先要讓具備感知和決策能力的機(jī)器人把SOP執(zhí)行明白,然后才能規(guī)模化,客戶才能更多導(dǎo)入。這是良性發(fā)展。至于SOP之后怎么發(fā)展,我覺得是人需要提供想象力,而不是AI。AI的自我迭代基于人的需求,會(huì)給出多種可能性,但人基于自身需求只選其中一條路徑。工業(yè)場景里客戶需求以終端客戶為導(dǎo)向,服務(wù)于人。
李星: 我補(bǔ)充一點(diǎn)。現(xiàn)在機(jī)器人動(dòng)作笨拙,不止是機(jī)器人本體的能力不夠,更重要的是具身智能模型能力還不夠。讓機(jī)器人擁有像人類一樣在物理世界里游刃有余的常識(shí)和直覺,甚至是擁有人類能工巧匠的豐富經(jīng)驗(yàn),核心路徑是通過模型訓(xùn)練。而這一路徑的核心,是首先要擁有海量的可用數(shù)據(jù),相比于大語言模型以及音視頻模型,物理世界的模態(tài)更為豐富,不只有聲音、視覺圖像,更要有物理交互核心的觸覺模態(tài)以及自體感知等數(shù)據(jù),而這些數(shù)據(jù)在此前是極度稀缺的,因此造成了具身智能模型泛化能力的發(fā)展極為緩慢。
為了解決這一具身智能核心瓶頸,帕西尼全球首創(chuàng)“以人為中心”的高精度感知全模態(tài)實(shí)采數(shù)據(jù)采集體系,由具有產(chǎn)業(yè)經(jīng)驗(yàn)、經(jīng)過專業(yè)訓(xùn)練的采集人員主導(dǎo),不僅可以在標(biāo)準(zhǔn)化的采集場景下采集多種場景的作業(yè)任務(wù)數(shù)據(jù),還突破性地走出受控環(huán)境限制,可以在開放式場景中進(jìn)行采集,這一采集方式,可以高精度捕捉觸覺、視覺、空間軌跡、自體感知、語音等物理世界全模態(tài)數(shù)據(jù),為模型訓(xùn)練構(gòu)筑了高可靠的數(shù)據(jù)底座。
去年6月,我們落地全球最大的具身智能全模態(tài)數(shù)據(jù)采集與模型訓(xùn)練基地——天津 SUPER EID Factory,并以超2億產(chǎn)能打造出全球首個(gè)全模態(tài)具身智能數(shù)據(jù)集Omnisharing DB,引發(fā)行業(yè)關(guān)注,數(shù)據(jù)上架至北京國際大數(shù)據(jù)交易所、騰訊云商城等頂級(jí)平臺(tái),得到產(chǎn)業(yè)龍頭、科研院校等多方認(rèn)可。今年,我們繼天津超級(jí)數(shù)采工廠之后,再建四廠,分別落地江蘇宿遷、湖北武漢、四川自貢、江西贛州,共同形成百億產(chǎn)能的具身智能全模態(tài)實(shí)采工廠集群,為具身智能行業(yè)發(fā)展再度注入澎湃動(dòng)力。
李非凡: 在具身智能應(yīng)用和人之間,工人如何更好匹配這些設(shè)備或agent工具,讓自己價(jià)值提升而不被替代?不光在你們場景,在IT coding、UI場景也有類似挑戰(zhàn)。你們場景里工人如何適應(yīng)、反替代?
韓曉璇: 機(jī)器人能把人從重復(fù)勞動(dòng)中解放出來。現(xiàn)在AI coding或agent讓大家提升管理能力和創(chuàng)新能力。以前年輕人做執(zhí)行層(碼農(nóng))的工作,未來每個(gè)人有一堆a(bǔ)gent或機(jī)器人,產(chǎn)線上一個(gè)人管理幾十臺(tái)機(jī)器人,就是管理者的工作:下清晰的需求、定標(biāo)準(zhǔn)、定流程,最終做好工藝創(chuàng)新和升級(jí)。這是工人層面提升的方向。至于機(jī)器人,不用太憂心,因?yàn)檫BSOP都還需要我們很大努力才能做到。人和具身智能機(jī)器人的關(guān)系,就像一個(gè)成年人養(yǎng)育一個(gè)小孩,初期投入很多養(yǎng)育成本,等他成長起來就能給你提供價(jià)值。
李星: 目前工業(yè)機(jī)器人在結(jié)構(gòu)化場景已被廣泛使用,證明了高效和降本增效。但在傳統(tǒng)工業(yè)機(jī)器人做不到的非結(jié)構(gòu)化場景,需要人形帶靈巧手的操作智能去落地。現(xiàn)在大家進(jìn)入數(shù)據(jù)元年,會(huì)深入細(xì)分場景、細(xì)分工況,通過穿戴式設(shè)備等采集真實(shí)工業(yè)數(shù)據(jù),用于機(jī)器人開發(fā)。整個(gè)鏈路環(huán)環(huán)相扣。等模型泛化能力夠了,一個(gè)人就能管理幾臺(tái)機(jī)器,我們給他設(shè)定需求就行。這一點(diǎn)我和韓總觀點(diǎn)一致。
李非凡: 非常感謝二位今天的參與,謝謝!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.