![]()
![]()
- 時代的機遇,
- 只眷顧那些早已準備好的人。
![]()
![]()
被數據“卡住”的具身智能,
需要一種現實解法
2026年,無疑是機器人從技術驗證走向產業應用的關鍵一年。當下的機器人,已經走出實驗室的演示階段,開始逐步進入到工業、公共服務等真實環境中。
然而技術驗證并不等于大規模商業化的到來。在不少行業人士看來,真實環境遠比實驗室復雜——光線變化、地面雜物、非標操作……每一個細節都可能讓機器人“失靈”。
泛化能力不足,仍是橫亙在具身智能規模化落地面前最難繞開的核心瓶頸。而這一困局的根源,指向行業普遍共識的數據桎梏。
問題首先出在數據匱乏和標準的不統一。百小時量級的數據僅能支撐單一動作的泛化——比如讓機器人學會分揀。而要實現真正意義上的通用具身智能,所需數據量需要數量級的躍升。
更棘手的是,各家企業的機器人本體構型不同,數據格式與采集邏輯難以互通,行業內部事實上已經形成了一道道隱形的數據壁壘,各自為戰、無法共享。
另一重壓力來自獲取的成本。大語言模型的訓練,可以借助互聯網上海量的公開文本完成預訓練,數據獲取的邊際成本極低。但機器人所需的數據截然不同——它必須來自真實物理世界的交互,采集鏈路長、標注難度高、復現成本大。這道門檻,對中小企業而言幾乎是一堵墻。
數據成本究竟有多高?國地中心數據負責人曾給出過一個直觀的估算:特斯拉人形機器人Optimus若要完全準備好在工廠獨立工作,至少需要數百萬小時的訓練數據,對應的數據采集成本可能高達5億美元。這個數字,已經足以讓絕大多數玩家望而卻步。
如果說算法是具身智能的大腦,數據就是讓大腦持續進化的燃料。真實世界的數據更像是一種與硬件深度綁定的工業產出——誰擁有設備、控制部署、理解場景,誰才有能力持續生產高價值數據。
“具身智能的數據,就是物理AI時代的基礎設施”,聆動通用CEO季超告訴36氪,在基礎設施還不夠完善的情況下,即使技術路線產生了突破之后,依然沒有辦法產生產品和市場級的商業突破。
聆動通用成立于2024年12月,作為科大訊飛在具身智能領域的戰略布局,是安徽省首家實現“大腦-小腦-本體”全鏈路自主可控的硬科技初創企業。其提出大腦-小腦-本體的分層端到端架構,正是在當前動作數據極度匱乏的現實約束下,為具身智能大規模產業落地蹚出的一條關鍵路徑。
對于核心競爭力,季超用“生態位”而非單點能力來定義:“訊飛生態 + 聆動通用垂直整合的全棧自主可控。”
這背后是三個層次的協同——數據端海量積累的真實作業數據讓模型真正貼近落地場景;模型端從預訓練到后訓練全鏈路自主可控,上述數據的優勢進一步強化了模型的優勢;硬件端則擁有觸達芯片級的工規級研發能力,真正滿足“進工廠、真干活”。在季超看來,聆動通用依托“全模態數據采集管線 + AI原生預訓練-后訓練模型全棧能力 + 工規級軟硬一體垂直整合的獨特生態位”才是行業里真正難以復制的壁壘。
借助其最新推出的具身智能通用機器人LDB與具身智能采訓推機器人LDT,聆動通用實現從數據采集、模型訓練、硬件部署與場景應用的完整閉環:讓機器人“干活”與“變聰明”同步發生,以此打通具身智能從實驗室走向真實產線的最后一公里。
![]()
大小腦結合:機器人
走向真實場景應用的更優解
為什么是大腦-小腦-本體的分層端到端架構?
在具身智能的技術分野中,“完全端到端”一度被視為最具想象力的方向:一個模型,從感知到決策再到執行,一步到位。但當機器人走出實驗室,進入真實產線時,問題開始集中暴露:機器人可以理解,卻無法穩定執行。
這主要是因為,工業場景對機器人實時性、穩定性與可控性的要求,遠高于任何消費級應用。一方面,由于大模型的推理本身存在延遲,難以支撐高速流水線下的連續操作;另一方面,端到端模型的“黑盒”屬性,在工業場景中意味著更高的不確定性。一旦出現誤判,很難定位問題來源,更難進行工程層面的修正。
這也是為什么,聆動通用所采用的“大小腦”分層端到端架構,為機器人走向產業落地提供了一種更現實的工程解法,它將具身智能的能力拆解為兩個協同運作的層級——大腦主感知決策,小腦主動作執行。二者背后各有一條獨立的數據管線支撐,各司其職、互不拖累。
首先,是作為大腦的行業級iFlyBot_VLM具身基礎模型,負責感知環境與任務決策。它基于互聯網海量數據預訓練而成,形成對特定任務的先驗知識,賦予機器人理解指令、推理意圖的能力。
其次,是作為小腦的iFlyBot_VLA技能操作模型,負責將大腦的決策指令轉化為柔性、可泛化的精準動作,并通過具身智能采訓推機器人在真實場景中持續采集的真機數據進行針對性微調,讓機器人具備可靠的落地執行能力。
聆動通用依托全棧自研的 iFlyBot_VLM 與 iFlyBot_VLA 模型能力,并接入訊飛生態近千人規模的數據團隊,已構建起覆蓋互聯網數據、仿真合成數據、Embodied UMI 真機數據及高精度同構遙操作數據的全鏈路數據體系。
這背后,是聆動通用構建的“數據-模型-硬件-應用”全鏈路閉環。通過機器人遙操作采集真實數據,然后反哺模型提升智能化水平,繼而輸出指令給硬件,實現“知行合一”,真正做到機器人既能干活,又能產生數據。
2026年4月16日,聆動通用全球首發新一代具身智能通用機器人——LDB01。其硬件規格按照工規級標準設計,算力、感知及功能安全模塊均針對工業嚴苛環境優化,是真正意義上滿足工業場景MTBF和壽命要求的具身智能機器人。
截至目前,聆動通用已經與物流、汽車、3C電子領域的頭部客戶進行驗證,預計可實現三周內快速上線部署。
某種意義上,分層端到端架構為具身智能產業化落地提供了一種“沿途下蛋”的商業選擇。它允許在達到“完全端到端”之前,先在特定的工業場景(如物流、汽車、3C電子)實現階段性落地,為具身智能企業創造商業現金流。
在季超看來,或許未來還有更高效的數據采集方式,但就當下而言,這是目前行業兼顧規模、成本、質量與效率的最優解決方案。
![]()
具身智能背后的萬億藍海:
聆動通用如何驅動產業落地?
當大小腦模式在真實場景中得到有效驗證,具身智能也逐漸迎來產業落地的下半場。
2026年,無疑是具身智能逼近規模化落地的臨界點。市場規模的爆發式增長與資本爭相涌入的熱情早已相互印證,這是一個萬億藍海賽道。據中商產業研究院分析師預測,2026年中國具身智能市場規模將達到10904億元。
但是在市場規模爆發之外,產業落地需要的不再只是誰的模型更強、誰的硬件在展會上更酷炫,而是誰能率先建立數據標準、打通產業生態、將技術能力真正轉化為可大規模復制的交付能力。
這正是聆動通用給自己設定的目標。在季超看來,聆動通用只做兩件事:第一個是數據,第二個則是應用。這本身就不是一家傳統機器人公司的創業思維。傳統機器人公司的核心競爭力是本體制造與運動控制,而聆動通用把數據和應用并列為戰略核心,依托自主可控的全模態數據采集管線、預訓練-后訓練模型全棧能力、工規級軟硬件一體化垂直整合的獨特生態位,實則是在構建具身智能時代的底層供給能力。
聆動通用從創立之初就沒有把自己框定為一家傳統的機器人公司,而是立志成為具身智能產業基礎設施的構建者。這背后,得益于科大訊飛體系的成熟孵化以及從技術研發到產品落地的連續性。“做大模型、自動駕駛和傳統工業機器人的公司均在積極布局具身智能。”季超說,“但我們在底層源頭技術的演進上,一直有非常清晰的連續性。”
對于2017年就加入科大訊飛、長期深耕機器人感知、交互與運動控制領域的他而言,具身智能從來不是一個風口,而是一件從未中斷過的事業。
資本市場對這份積累給出了快速回應。成立不到一年,聆動通用已完成三輪融資。其中去年8月披露的數億元人民幣天使輪融資,由元禾璞華領投、訊飛創投加碼——老股東的持續押注,新一輪融資即將敲定,是對這支團隊最有力的背書。
作為具身智能產業基礎設施的構建者,聆動通用也在用實際行動兌現這一價值定位。
在科技創新層面,聆動通用聚焦打造高泛化性的具身大模型和通用魯棒的機器人本體,推出了全棧自研的“行業級iFlyBot-VLM視覺語言基座大模型和iFlyBot-VLA視覺-語言-動作操作大模型”分層端到端架構。
在成果轉化上,聆動通用最新發布的LDB通用機器人歷經六輪內部迭代,自研率超過90%,算力、感知與功能安全模塊全部按照工規級標準設計,是真正意義上能夠在工業嚴苛環境下持續穩定作業的生產力工具。
在產業賦能上,聆動通用的目光落得更遠。作為副組長單位,深度參與工信部首個具身智能行業標準的起草制定,該標準將于今年6月1日正式試行;同時推出國內首個具身智能基準測試評測標準,成為國內首批、安徽省首個通過可信AI評測的企業之一,讓具身智能告別技術混戰,走向有標可依的規范化發展。
季超強調,聆動通用打造的是未來懂知識、善學習、能進化的硅基勞動力,不是一種工具,而是直接創造結果的生產伙伴,“我們致力于改變在制造業領域勞動力逐漸缺失,人類越來越不愿意從事繁重的體力勞動的現狀,用具身智能 + 機器人重新賦能傳統制造業智能化升級”。
作為人工智能走向現實世界的重要載體,具身智能所帶來的新質生產力升級遠不止于制造業。從物流、醫療到公共服務,智能正在突破認知層的邊界,第一次真正進入物理世界、作用于真實生產。
這場生產力革命的起點,已經從每一條有序運轉的工業產線上悄然發生。就在萬億級市場爆發的前夜,聆動通用以多年的技術積累與產業驗證為基礎,率先打通了從數據到應用的全鏈路閉環。而這條路,正在成為具身智能規模化落地最清晰的一條航線。
時代的機遇,只眷顧那些早已準備好的人。夯實數據地基,托舉產業未來——正是聆動通用選擇的使命,也是它認為這個時代最值得全力以赴的一件事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.