337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ollama v0.19.0 發(fā)布!Web 搜索插件上線、多模型兼容修復(fù)、MLX 與 KV 緩存全面優(yōu)化,本地大模型體驗(yàn)再升級

0
分享至




ollama v0.19.0于2026年3月30日正式發(fā)布,作為本地大模型部署與運(yùn)行的核心工具,本次更新聚焦用戶體驗(yàn)優(yōu)化、功能增強(qiáng)與底層問題修復(fù),覆蓋應(yīng)用交互、插件能力、API性能、模型兼容、MLX運(yùn)行器、注意力機(jī)制等多個核心維度,同時包含26次提交、58個文件改動,全面提升ollama的穩(wěn)定性、兼容性與實(shí)用性。

一、核心功能更新

  1. 1.應(yīng)用體驗(yàn)優(yōu)化
    ollama應(yīng)用將不再錯誤顯示“模型已過時”提示,徹底解決此前版本中模型狀態(tài)判斷異常的問題,避免用戶被無效提示干擾,提升使用流暢度。

  2. 2.Web搜索插件集成
    ollama launch pi功能新增內(nèi)置Web搜索插件,該插件直接使用ollama官方Web搜索能力,無需額外配置即可讓本地模型具備聯(lián)網(wǎng)搜索能力,拓展本地大模型的信息獲取邊界,支持實(shí)時檢索最新數(shù)據(jù)。

  3. 3.Anthropic兼容API性能提升
    優(yōu)化使用Anthropic兼容API時的KV緩存命中率,減少重復(fù)計算與資源消耗,提升API調(diào)用的響應(yīng)速度與效率,尤其在高頻、長對話場景下效果顯著。

  4. 4.Qwen3.5模型工具調(diào)用修復(fù)
    修復(fù)Qwen3.5模型工具調(diào)用解析問題,解決此前版本中工具調(diào)用內(nèi)容被錯誤輸出在思考模塊的問題,確保工具調(diào)用邏輯清晰、結(jié)果準(zhǔn)確,保障Qwen3.5模型的函數(shù)調(diào)用能力正常生效。

  5. 5.MLX運(yùn)行器增強(qiáng)

  • ? MLX運(yùn)行器在提示詞處理過程中會創(chuàng)建周期性快照,實(shí)現(xiàn)狀態(tài)的持續(xù)備份,避免處理中斷導(dǎo)致的進(jìn)度丟失;

  • ? 修復(fù)MLX運(yùn)行器中KV緩存快照的內(nèi)存泄漏問題,優(yōu)化內(nèi)存資源占用,提升長時間運(yùn)行的穩(wěn)定性;

  • ? 優(yōu)化MLX運(yùn)行器的緩存驅(qū)逐與LRU跟蹤邏輯,提升緩存管理效率;

  • ? 合并setStateRaw與setStateDetached為setState,簡化API調(diào)用邏輯,降低開發(fā)與使用復(fù)雜度。

  1. 6.模型兼容與機(jī)制修復(fù)

  • ? 修復(fù)Grok模型的Flash Attention錯誤啟用問題,確保Grok模型在ollama中運(yùn)行時,注意力機(jī)制配置符合模型特性,避免性能異常或兼容性問題;

  • ? 解決qwen3-next:80b模型無法在ollama中加載的問題,完善對該大參數(shù)模型的支持,拓展ollama可運(yùn)行的模型范圍。

二、提交與改動詳情(按時間梳理) 2026年3月25日
  • ? ggml模塊:強(qiáng)制關(guān)閉Grok模型的Flash Attention,從底層解決Grok模型注意力機(jī)制配置錯誤問題。

2026年3月26日
  • ? MLX模塊:修復(fù)KV緩存快照內(nèi)存泄漏,優(yōu)化內(nèi)存管理;

  • ? MLX運(yùn)行器:改進(jìn)緩存驅(qū)逐與LRU跟蹤邏輯,提升緩存效率;

  • ? MLX運(yùn)行器:在預(yù)填充階段調(diào)度周期性快照,實(shí)現(xiàn)狀態(tài)自動備份;

  • ? MLX運(yùn)行器:合并setState相關(guān)接口,簡化調(diào)用邏輯;

  • ? 文檔:更新VS Code相關(guān)文檔,完善開發(fā)工具集成說明;

  • ? launch模塊:隱藏VS Code集成入口、Cline集成入口;

  • ? launch/vscode模塊:優(yōu)先使用已知VS Code路徑,而非PATH中的code命令,提升工具調(diào)用準(zhǔn)確性。

2026年3月27日
  • ? TUI模塊:更新聊天標(biāo)題,優(yōu)化交互界面展示;

  • ? CI模塊:在Linux系統(tǒng)中包含MLX JIT頭文件,完善編譯依賴;

  • ? launch模塊:對本地模型,當(dāng)服務(wù)器上下文長度低于64k時發(fā)出警告,幫助用戶提前規(guī)避長文本處理問題;

  • ? CI模塊:強(qiáng)化CUDA包含路徑處理,提升GPU環(huán)境兼容性;

  • ? 模型解析器:修復(fù)Qwen3.5工具塊在思考塊中啟動時的關(guān)閉邏輯,解決工具調(diào)用解析異常;

  • ? 解析器:優(yōu)化Qwen3.5流式工具調(diào)用解析,并添加回歸測試,保障功能穩(wěn)定性;

  • ? 應(yīng)用模塊:修復(fù)模型“過時”錯誤提示,優(yōu)化用戶體驗(yàn);

  • ? Anthropic模塊:修復(fù)因工具調(diào)用參數(shù)重排序?qū)е碌腒V緩存復(fù)用降級問題,提升API性能;

  • ? launch模塊:跳過MLX模型的上下文長度警告,并顯示模型名稱,優(yōu)化提示邏輯;

  • ? Anthropic模塊:修復(fù)內(nèi)容塊中的空輸入問題,避免API調(diào)用異常;

  • ? 服務(wù)器模塊:拉取模型時保留原始清單字節(jié),保障模型完整性。

2026年3月28日
  • ? MLX模塊:修復(fù)視覺能力與最低版本兼容問題,完善多模態(tài)支持;

  • ? launch模塊:自動安裝pi并管理Web搜索生命周期,簡化插件使用流程;

  • ? launch模塊:優(yōu)化已添加模型的多選功能,提升操作便捷性;

  • ? 回滾上下文長度警告變更,調(diào)整提示策略。

2026年3月29日
  • ? 模型模塊:為qwen3-next添加對傳統(tǒng)ssm_in投影的兼容性,解決模型加載失敗問題;

  • ? 命令模塊:在配置中設(shè)置OpenCode默認(rèn)模型,優(yōu)化模型調(diào)用默認(rèn)配置。

三、更新總結(jié)

代碼地址:bgithub.xyz/ollama/ollama

ollama v0.19.0版本從用戶體驗(yàn)、功能拓展、底層性能、模型兼容四大方向發(fā)力,新增Web搜索插件拓展本地模型能力,修復(fù)多模型(Qwen3.5、Grok、qwen3-next:80b)的核心問題,優(yōu)化MLX運(yùn)行器與KV緩存機(jī)制,同時完善API、CI、工具集成等模塊的細(xì)節(jié),全面提升ollama的穩(wěn)定性、兼容性與易用性,為本地大模型開發(fā)者與用戶提供更優(yōu)質(zhì)的運(yùn)行環(huán)境。

我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我們并沒有用40年走完發(fā)達(dá)國家200年的路

我們并沒有用40年走完發(fā)達(dá)國家200年的路

文青大叔說
2026-03-13 08:13:38
“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

大風(fēng)新聞
2026-04-06 15:06:12
跳水運(yùn)動員全紅嬋涉嫌遭網(wǎng)暴,全紅嬋所在訓(xùn)練中心已向公安機(jī)關(guān)報警

跳水運(yùn)動員全紅嬋涉嫌遭網(wǎng)暴,全紅嬋所在訓(xùn)練中心已向公安機(jī)關(guān)報警

界面新聞
2026-04-08 12:41:59
“中年男人專供”,圍獵年輕女孩

“中年男人專供”,圍獵年輕女孩

DT商業(yè)觀察
2026-04-08 11:56:15
明星最好的醫(yī)美就是醫(yī)美

明星最好的醫(yī)美就是醫(yī)美

仙女事件簿
2026-04-08 23:38:09
王寶強(qiáng)和女友開京牌大G到青島,馮清人高馬大,襯得寶強(qiáng)像小嬌夫

王寶強(qiáng)和女友開京牌大G到青島,馮清人高馬大,襯得寶強(qiáng)像小嬌夫

八怪娛
2026-04-07 15:02:12
隨著本澤馬獨(dú)造4球+C羅爭冠勁敵6-0碾壓,沙特聯(lián)最新積分榜出爐

隨著本澤馬獨(dú)造4球+C羅爭冠勁敵6-0碾壓,沙特聯(lián)最新積分榜出爐

側(cè)身凌空斬
2026-04-09 04:33:45
英國74歲奶奶獨(dú)自游中國,各地網(wǎng)友接力搶著當(dāng)導(dǎo)游,吉首大學(xué)學(xué)生:她在享受生活

英國74歲奶奶獨(dú)自游中國,各地網(wǎng)友接力搶著當(dāng)導(dǎo)游,吉首大學(xué)學(xué)生:她在享受生活

瀟湘晨報
2026-04-08 18:04:41
NBA調(diào)查!國王回應(yīng)故意犯規(guī)罰球高手小庫里:戰(zhàn)術(shù)失誤而非擺爛

NBA調(diào)查!國王回應(yīng)故意犯規(guī)罰球高手小庫里:戰(zhàn)術(shù)失誤而非擺爛

羅說NBA
2026-04-09 06:14:42
中國石化:公司原油探明儲量2074百萬桶,天然氣探明儲量10029十億立方英尺

中國石化:公司原油探明儲量2074百萬桶,天然氣探明儲量10029十億立方英尺

每日經(jīng)濟(jì)新聞
2026-04-08 18:14:24
伺候36年,陳麗華470億遺產(chǎn)全歸子女,“唐僧”遲重瑞白忙一場?

伺候36年,陳麗華470億遺產(chǎn)全歸子女,“唐僧”遲重瑞白忙一場?

混沌錄
2026-04-08 18:38:14
窮可以卑微到什么地步?網(wǎng)友:換我早身心崩潰了

窮可以卑微到什么地步?網(wǎng)友:換我早身心崩潰了

夜深愛雜談
2026-03-12 21:00:23
2-0!亞馬爾被凍結(jié),小蜘蛛世界波,馬競終結(jié)魔咒,巴薩命懸一線

2-0!亞馬爾被凍結(jié),小蜘蛛世界波,馬競終結(jié)魔咒,巴薩命懸一線

我的護(hù)球最獨(dú)特
2026-04-09 05:01:50
網(wǎng)友好奇:網(wǎng)暴全紅嬋的群主是誰?群內(nèi)真有現(xiàn)役運(yùn)動員嗎?

網(wǎng)友好奇:網(wǎng)暴全紅嬋的群主是誰?群內(nèi)真有現(xiàn)役運(yùn)動員嗎?

羅納爾說個球
2026-04-08 23:08:09
賈國龍59元燜面實(shí)測后,網(wǎng)友喊話羅永浩:當(dāng)初罵西貝算是白罵了

賈國龍59元燜面實(shí)測后,網(wǎng)友喊話羅永浩:當(dāng)初罵西貝算是白罵了

房產(chǎn)衫哥
2026-04-09 05:09:46
全紅嬋被集體霸凌,隊(duì)友潛伏攻擊全紅嬋內(nèi)部群,聊天記錄被曝光!

全紅嬋被集體霸凌,隊(duì)友潛伏攻擊全紅嬋內(nèi)部群,聊天記錄被曝光!

眼光很亮
2026-04-08 12:10:03
鄭麗文受邀訪問大陸,祖國統(tǒng)一已經(jīng)進(jìn)入倒計時

鄭麗文受邀訪問大陸,祖國統(tǒng)一已經(jīng)進(jìn)入倒計時

楓冷慕詩
2026-04-08 11:57:00
燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個

燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個

阿芒娛樂說
2026-04-08 05:22:19
害女童兇手被揭底!常年分居,村民曝駭人細(xì)節(jié),坐牢算輕的

害女童兇手被揭底!常年分居,村民曝駭人細(xì)節(jié),坐牢算輕的

哄動一時啊
2026-04-08 20:05:21
1938年老蔣制造黃河決堤,日軍淹死數(shù)量驚人,真實(shí)情況你可能不信

1938年老蔣制造黃河決堤,日軍淹死數(shù)量驚人,真實(shí)情況你可能不信

浩舞默畫
2026-04-06 09:22:04
2026-04-09 11:20:49
moonfdd incentive-icons
moonfdd
福大大架構(gòu)師每日一題
1172文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

頭條要聞

福建45歲女子駕車墜河5人遇難有3名兒童 家屬最新發(fā)聲

體育要聞

40歲,但實(shí)力倒退12年

娛樂要聞

具俊曄最新露面,又黑又瘦情緒低迷

財經(jīng)要聞

談判基礎(chǔ)已被破壞!霍爾木茲海峽關(guān)閉

汽車要聞

8155芯片+L2智駕 瑞虎5運(yùn)動版上市 置換補(bǔ)貼價6.79萬元起

態(tài)度原創(chuàng)

手機(jī)
家居
時尚
公開課
軍事航空

手機(jī)要聞

蘋果要花3年重新定義iPhone!探索無開孔終極形態(tài)

家居要聞

清新自然 復(fù)古風(fēng)尚

ED網(wǎng)紅病,正在掏空年輕女性

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霍爾木茲海峽已再次關(guān)閉

無障礙瀏覽 進(jìn)入關(guān)懷版