![]()
智東西
作者 佳揚
編輯 云鵬
智東西4月9日消息,今日MiniMax稀宇科技發布MMX-CLI,這是一款面向AI Agent的命令行工具。
官方稱,MMX-CLI支持在Claude Code、OpenClaw等環境中原生調用其全模態模型,涵蓋編程、視頻生成、語音合成和音樂創作等功能,無需額外編寫MCP Server或適配復雜接口。僅需兩行代碼,即可完成MMX-CLI的安裝和調用。
MMX-CLI提供全面的多模態能力,包括多回合文本對話和流媒體輸出、可調整尺寸和批量生成的圖像、支持異步處理和進度跟蹤的視頻生成、多語音文本轉語音和流媒體播放、帶歌詞的音樂創作,以及圖像理解和描述功能,幫助AI Agent高效完成創作和分析任務。
目前,MMX-CLI需要購買Token plan才能使用。Token Plan價格根據不同的套餐和使用量而有所不同。官方提供了多檔訂閱方案,用戶可以按月或按年支付,每個套餐對應不同的Token額度和調用上限。其中標準版Starter套餐每月29元,Plus套餐每月49元,Max套餐每月119元;極速版Plus-極速版每月98元,Max-極速版每月199元,Ultra-極速版每月899元。
![]()
▲Token plan
一、兩行命令完成安裝和調用
MMX-CLI將MiniMax的多模態能力通過統一命令行接口開放給Agent,涵蓋文本、圖像、視頻、語音、音樂等核心能力。
·文本處理:支持多回合對話、流式輸出、系統提示詞和JSON格式,使Agent可直接解析和調用生成內容。
·圖像生成:文本轉圖像功能支持寬高比調整和批量生成。
·視頻生成:提供異步處理和進度跟蹤。
·語音合成:多語音文本轉語音和流媒體播放能力,擁有30多種音色。
·音樂創作:基于文本生成音樂,可自定義歌詞,實現自動化音樂制作與內容豐富化。
·圖片理解:圖像描述與識別。
![]()
▲主要功能
官方稱,Agent可通過兩行命令完成安裝和調用,實現從文案生成到圖像、語音和視頻輸出的完整自動化工作流,大幅提升多模態任務效率。
![]()
▲官方安裝代碼
![]()
▲官方文本、圖片、音頻生成代碼
二、針對Agent的專門優化
傳統命令行工具主要面向人工用戶,直接讓AI Agent使用往往會遇到問題,例如輸出信息夾雜干擾內容、錯誤信息需要人工閱讀判斷、參數缺失會導致任務停滯,以及長時間運行的任務無法高效管理等。
對此,MMX-CLI針對Agent在非交互式環境下的使用特點進行了底層優化:
·純數據輸出與隔離:stdout僅輸出文件路徑或JSON數據,進度條和狀態提示被劃歸stderr,保證Agent解析結果干凈準確。
·語義化狀態碼:不同錯誤類型對應獨立Exit Code,Agent無需解析文本即可判斷失敗原因并決定是否重試,包括鑒權、參數缺失、超時和網絡異常。
·異步與非阻塞設計:任務參數缺失時直接退出,長耗時任務可通過提交后臺執行,使Agent能并行處理多個任務。
·無縫接入Token Plan:每次生成可直接計入訂閱配額,方便使用和管理,同時避免額外付費或復雜授權流程。
MiniMax官方提供了完整文檔和源碼,開發者和企業可在GitHub獲取。
完整文檔與源碼:github.com/MiniMax-AI/cliToken Plan
訂閱:platform.minimaxi.com/subscribe/token-plan
結語:MiniMax全模態能力的拓展
MMX-CLI的推出為開發者提供了一個輕量入口,讓MiniMax的全模態能力更容易嵌入現有AI Agent工具鏈中。對于終端重度用戶和需要快速調用圖像、視頻、語音的場景,它簡化了流程。
目前工具仍處于早期階段,功能覆蓋全面但缺乏大規模公開性能數據。未來隨著迭代,其在Agent生態中的實用性值得持續觀察。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.