337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

lmdeploy v0.11.1 版本發(fā)布:全面支持DeepSeek V3.2與DPTP,多項性能優(yōu)化與Bug修復

0
分享至




lmdeploy v0.11.1 于 2025 年 12 月 24 日正式發(fā)布。本次版本更新圍繞功能增強、性能與架構優(yōu)化、問題修復、文檔完善以及工程與測試體系建設等多個方面展開,進一步提升了模型部署、推理服務和多模態(tài)場景下的整體可用性與穩(wěn)定性。以下為本次版本更新的詳細解讀。

一、新增功能(Features)

在功能層面,v0.11.1 引入了多項重要支持能力。
首先,Ascend 平臺新增了對 dptp 的支持,進一步增強了在特定硬件環(huán)境下的部署靈活性。
其次,正式支持 Deepseek v32 模型,使 lmdeploy 能夠覆蓋更多新一代大模型推理需求。

這些功能擴展為用戶在不同模型和不同硬件架構下的部署提供了更廣泛的選擇。

二、改進與增強(Improvements)

在性能和功能增強方面,本次版本更新內容尤為豐富。

  1. 1. 監(jiān)控與指標體系
    對 metrics 進行了改進,使性能監(jiān)控和運行狀態(tài)統(tǒng)計更加完善,有助于生產(chǎn)環(huán)境中的觀測與調優(yōu)。

  2. 2. 調度與引擎優(yōu)化
    重構了調度器與 engine.py,優(yōu)化了內部結構,提高了整體執(zhí)行效率和可維護性。同時對 dp 超時時間進行了更新,使分布式場景下的任務調度更加穩(wěn)定。

  3. 3. 模型與多模態(tài)支持增強
    針對 Qwen3-VL 模型進行了多項改進,包括新增 vision id、增加多模態(tài)處理器參數(shù),以及整體能力優(yōu)化,顯著提升了多模態(tài)推理的一致性與可擴展性。

  4. 4. 推理與請求處理能力
    在請求被取消時,系統(tǒng)現(xiàn)在能夠返回已路由的專家信息,提升了推理過程中的可解釋性。
    同時,v1/chat/completions 接口新增對 chat_template_kwargs 的支持,使對話模板配置更加靈活。

  5. 5. 內部結構與內存處理
    為 dummy 輸入預留 block,優(yōu)化了內存使用策略;在預填充階段構建 block trie 并增加命中率統(tǒng)計,提升了緩存與推理效率。

三、問題修復(Bug Fixes)

v0.11.1 對多個已知問題進行了修復,顯著增強了系統(tǒng)穩(wěn)定性和安全性。

  1. 1. 推理與路由相關修復
    修復了按 query 長度拆分路由專家的問題,解決了部分場景下結果異常的問題。
    修復了混合請求返回 logprobs 時的請求處理異常。

  2. 2. 多進程與分布式問題
    修復了多進程環(huán)境下 HuggingFace 模塊讀寫沖突的問題。
    修復了特定硬件環(huán)境中 ray 與內存同步相關的問題。

  3. 3. 量化與數(shù)值處理修復
    修復了多項與量化相關的問題,包括 quant8 的 fillkv、量化 scale-fmt 處理錯誤以及相關格式問題,保障了低精度推理的正確性。

  4. 4. 模型與處理器修復
    修復了處理器參數(shù)錯誤、fope 相關問題,并移除了在 RPC 調用中可能引發(fā) pickle 配置錯誤的 get_model_config 調用。

  5. 5. 安全性修復
    修復了在調用 torch.load 時可能存在的不安全反序列化問題,進一步提升了系統(tǒng)安全性。

四、文檔更新(Documentations)

在文檔方面,本次版本新增了 VLMEvalKit 使用指南,為多模態(tài)模型評測提供了更清晰的參考說明,有助于用戶快速上手和規(guī)范化評測流程。

五、其他更新(Other)

代碼地址:github.com/InternLM/lmdeploy

在工程與測試體系方面,v0.11.1 也進行了多項補充與完善。

  1. 1. 新增 FA3 支持,擴展了底層能力選項。

  2. 2. 新增分布式測試用例和生成測試用例,提升了版本質量保障能力。

  3. 3. 在持續(xù)集成流程中加入了多模態(tài)大模型評測。

  4. 4. Ascend 相關代碼進行了重構,使結構更加清晰。

  5. 5. Docker 鏡像構建過程中新增自動安裝 serve.txt,簡化部署流程。

  6. 6. 版本號正式更新至 v0.11.1。

總結來看,lmdeploy v0.11.1 是一次內容全面且扎實的版本更新,不僅擴展了模型與硬件支持范圍,也在性能、穩(wěn)定性、安全性和工程化能力上進行了系統(tǒng)性提升,非常適合在生產(chǎn)和研究環(huán)境中升級使用。

我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關注“福大大架構師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
程序員哭泣:被阿里裁員3年了,收入巔峰永遠停在2022年了,125萬

程序員哭泣:被阿里裁員3年了,收入巔峰永遠停在2022年了,125萬

黯泉
2026-04-08 20:26:04
特朗普被問戰(zhàn)爭罪當場破防,紐約時報反嗆:你當年還夸我們準

特朗普被問戰(zhàn)爭罪當場破防,紐約時報反嗆:你當年還夸我們準

熱搜摘要官
2026-04-08 08:10:57
000638,年內42個跌停板,股價首次跌破面值

000638,年內42個跌停板,股價首次跌破面值

數(shù)據(jù)寶
2026-04-09 16:23:53
中美印耕地面積對比:美國25億畝,印度24億畝,中國多少畝?

中美印耕地面積對比:美國25億畝,印度24億畝,中國多少畝?

云景侃記
2026-04-04 22:24:20
老師給外籍小朋友剝蝦視頻瘋傳,評論區(qū)罵慘了,怒斥:枉為人師

老師給外籍小朋友剝蝦視頻瘋傳,評論區(qū)罵慘了,怒斥:枉為人師

談史論天地
2026-04-09 08:46:08
MVP爭奪戰(zhàn)驚天反轉:規(guī)則殺死了最偉大的賽季

MVP爭奪戰(zhàn)驚天反轉:規(guī)則殺死了最偉大的賽季

茅塞盾開本尊
2026-04-09 12:36:38
中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發(fā)病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
NASA發(fā)布“最清晰的月球照片”,地球無法觀察的月背:細節(jié)滿滿

NASA發(fā)布“最清晰的月球照片”,地球無法觀察的月背:細節(jié)滿滿

環(huán)球科學貓
2026-04-09 13:11:52
長沙頻繁下雨衣柜都“發(fā)霉”了,專家:霉菌毒性是砒霜的68倍,收好這份除霉秘訣

長沙頻繁下雨衣柜都“發(fā)霉”了,專家:霉菌毒性是砒霜的68倍,收好這份除霉秘訣

瀟湘晨報
2026-04-08 21:25:15
以色列阻止美伊談判未果,特朗普想盡快退出,而以色列想繼續(xù)

以色列阻止美伊談判未果,特朗普想盡快退出,而以色列想繼續(xù)

山河路口
2026-04-09 17:45:55
鬧大了!全紅嬋報警后續(xù):央視下場,鐵證曝光,群解散但人跑不掉

鬧大了!全紅嬋報警后續(xù):央視下場,鐵證曝光,群解散但人跑不掉

米果說識
2026-04-09 17:18:41
已飛行250億公里!最遠飛船傳回的最后一張照片,顛覆人類的認知

已飛行250億公里!最遠飛船傳回的最后一張照片,顛覆人類的認知

老黯談娛
2026-04-09 10:04:23
馬筱梅不忍了!張?zhí)m生日第二天,連發(fā)好幾條澄清,局面很難扭轉

馬筱梅不忍了!張?zhí)m生日第二天,連發(fā)好幾條澄清,局面很難扭轉

離離言幾許
2026-04-09 00:04:01
70歲大媽的罕見養(yǎng)老法:不麻煩子女不再婚,不去養(yǎng)老院不請保姆

70歲大媽的罕見養(yǎng)老法:不麻煩子女不再婚,不去養(yǎng)老院不請保姆

熱心柚子姐姐
2026-04-08 16:42:35
6歲女童遇害:家屬含淚爆作案動機,兇手被抓后冷靜異常,太憤怒

6歲女童遇害:家屬含淚爆作案動機,兇手被抓后冷靜異常,太憤怒

眼光很亮
2026-04-07 11:38:00
趁火打劫!狼隊如降級或送曼聯(lián)豪禮,紅魔有望迎來卡塞米羅接班人

趁火打劫!狼隊如降級或送曼聯(lián)豪禮,紅魔有望迎來卡塞米羅接班人

體壇鑒春秋
2026-04-09 12:34:23
折疊屏賽道風向突變!安卓廠商扎堆跟進闊折疊:紛紛對標蘋果

折疊屏賽道風向突變!安卓廠商扎堆跟進闊折疊:紛紛對標蘋果

快科技
2026-04-09 17:41:16
樊振東放棄世乒賽原因曝光!再收3好1壞消息,王楚欽冰火兩重天!

樊振東放棄世乒賽原因曝光!再收3好1壞消息,王楚欽冰火兩重天!

曹說體育
2026-04-09 14:01:45
參觀洋山港后,鄭麗文一句話,向大陸示好,賴清德要氣炸了

參觀洋山港后,鄭麗文一句話,向大陸示好,賴清德要氣炸了

天氣觀察站
2026-04-09 17:20:23
好干凈的女子,膀大腰圓,眉清目秀,膚白貌美,氣質絕!

好干凈的女子,膀大腰圓,眉清目秀,膚白貌美,氣質絕!

手工制作阿殲
2026-04-09 07:42:48
2026-04-09 19:12:49
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1172文章數(shù) 63關注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場上

娛樂要聞

金莎官宣結婚 與老公孫丞瀟相差18歲

財經(jīng)要聞

停火首日,霍爾木茲僅有4艘船通過

汽車要聞

文飛的回歸 給神行者帶來什么?

態(tài)度原創(chuàng)

藝術
親子
時尚
旅游
本地

藝術要聞

龐茂琨 2026油畫寫生新作

親子要聞

家庭聚會了

ED網(wǎng)紅病,正在掏空年輕女性

旅游要聞

2026第20屆王屋山文旅節(jié)將至 單霽翔等名家助陣濟源

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

無障礙瀏覽 進入關懷版