谷歌宣布推出 Gemini 3.1 Flash-LITE 模型,面向開發者大規模高頻工作負載優化,預覽版正式開放。該模型號稱 Gemini 系列中速度最快、性價比最高版本,在多項基準測試中超越同類競品,引發全球開發者關注。
![]()
AI生成
官方數據顯示,Gemini 3.1 Flash-LITE 首個答案響應時間較上一代提升 2.5 倍,輸出速度提升 45%,在 GPQA Diamond、MMMU Pro 等權威測試中表現優異,超過 GPT-5 Mini 等對手。模型支持最長 100 萬 Token 上下文窗口,定價為 0.25 美元 / 百萬輸入、1.5 美元 / 百萬輸出,適合高頻調用、批量處理、實時交互場景。
谷歌表示,新模型專為企業客服、內容生產、代碼開發、數據解析等高頻場景設計,在保持能力的同時大幅降低成本與延時,推動 AI 從實驗走向規模化商用。
隨著模型開放,更多應用將迎來速度與成本優化,尤其是 AI Agent、自動化工具、實時交互產品將顯著受益。未來,極速輕量模型將成為行業標配,推動 AI 滲透到更多實時性要求高的場景。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.