4月16日消息,逐際動力(LimX Dynamics)正式開源“FluxVLA Engine”,這是一個面向具身智能領域的全棧視覺-語言-動作工程平臺。據了解,該平臺旨在通過統一的配置管理與模塊化設計,為從數據處理、模型訓練、仿真評估到真實機器人部署的全流程提供標準化工程支持。
![]()
據其官方介紹,FluxVLA Engine針對當前具身智能研發落地中存在的幾大工程瓶頸提出了解決方案。首先,在數據層面,平臺支持LeRobot等標準化數據集格式,并提供了數據轉換工具,以應對不同來源數據格式碎片化的問題。其次,在架構設計上,平臺采用了模塊化解耦的思路,視覺編碼器、語言模型、動作預測頭等核心組件均可通過標準接口進行替換,無需修改整體訓練框架。此外,平臺還針對從仿真環境到真實硬件的“部署鴻溝”,集成了推理加速與軌跡平滑等優化技術。
據悉,該平臺在功能上覆蓋了當前主流的VLA模型架構,包括GR00T、OpenVLA、Pi系列以及最新支持的DreamZero等。在硬件支持方面,目前已兼容UR系列機械臂、ALOHA雙臂系統以及逐際動力自研的TRON 2機器人。平臺強調“訓練即部署”,力圖簡化模型在真實機器人上的應用流程。
在性能優化方面,該平臺集成了包括Triton推理引擎、CUDA Graph等技術以實現推理加速。同時,通過集成RTC等軌跡平滑方法,旨在減少模型輸出動作的抖動,提升真機執行的穩定性和流暢性。
該項目的代碼、文檔及預訓練模型權重已在GitHub、Hugging Face及ModelScope等平臺發布,供開發者與研究社區使用。(崔玉賢)
