337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

ollama v0.20.0 更新:Gemma 4 全家桶發布,音頻、視覺、MoE、BPE 支持全面升級

0
分享至




2026年4月3日,ollama 發布了v0.20.0版本。
這次更新的核心非常明確:Gemma 4 正式加入支持,并且圍繞模型推理、音頻能力、Tokenizer、視覺測試、轉換器、OpenAI 音頻接口等多個方向進行了集中增強。

如果你關注本次更新,可以直接從兩個關鍵詞理解:

  • ?Gemma 4

  • ?音頻與推理能力升級

下面按照本次版本更新內容,逐項整理成一篇完整的技術更新說明。

一、Gemma 4 正式加入支持

本次 v0.20.0 最重要的變化,就是Gemma 4相關支持的加入。
更新中給出了多個可直接運行的模型規格:

1)Effective 2B(E2B)

運行命令:

ollama run gemma4:e2b

這是 Gemma 4 的有效 2B 版本,適合輕量場景使用。

2)Effective 4B(E4B)

運行命令:

ollama run gemma4:e4b

這是 Gemma 4 的有效 4B 版本,在能力和資源消耗之間做了更平衡的選擇。

3)26B(Mixture of Experts model with 4B active parameters)

運行命令:

ollama run gemma4:26b

這是一個MoE(Mixture of Experts)模型,描述中說明其4B active parameters

4)31B(Dense)

運行命令:

ollama run gemma4:31b

這是 Gemma 4 的31B Dense版本,屬于更大規模的稠密模型。

從這次發布的信息來看,Gemma 4 已經形成了較完整的規格覆蓋,從輕量到大模型都提供了支持方式,用戶可以按資源和場景選擇對應版本。

二、What's Changed:本次更新涉及的關鍵內容

本次版本的更新記錄非常集中,主要圍繞 Gemma 4、音頻、Tokenizer、文檔、推理與測試展開。下面逐條梳理。

三、文檔更新

首先是文檔相關更新:

  • ?docs: update pi docs

這說明本次版本中對 pi 相關文檔進行了更新。
雖然內容本身不多,但說明文檔層面同步跟進了新版本變化,方便用戶查閱和使用。

四、Tokenizer 增強:支持 SentencePiece-style BPE

本次更新中有一個非常關鍵的底層能力變化:

  • ?tokenizer: add SentencePiece-style BPE support

這表示 Tokenizer 新增了SentencePiece 風格的 BPE 支持
這一變化對于模型適配和分詞處理非常重要,尤其是在處理不同模型格式與分詞規則時,可以提升兼容性。

與此同時,后續也有與 tokenizer 相關的配套修復:

  • ?mlx: respect tokenizer add_bos_token setting in pipeline

這個改動說明在 pipeline 中會尊重 tokenizer 的add_bos_token設置。
換句話說,Tokenizer 的行為會更貼合配置,避免在處理輸入時出現不一致情況。

五、Gemma 4 的模型支持與轉換器更新 1)Gemma 4 GGML 模型支持

更新中明確寫到:

  • ?gemma4: add Gemma 4 GGML model support

這表示 Gemma 4 的 GGML 模型支持已經加入。

2)轉換器更新:適配新的 weight drop 命名

  • ?gemma4: update converter for new weight drop naming

這說明 Gemma 4 相關轉換器已經根據新的 weight drop 命名進行了更新。
這是模型轉換流程中非常關鍵的一環,確保新版本模型文件命名和導入過程能夠順利對接。

六、音頻能力大幅增強

這次 v0.20.0 在音頻方向的變化非常密集,可以說是重點之一。

1)添加音頻支持,使用 USM conformer encoder

更新內容:

  • ?gemma4: add audio support with USM conformer encoder

這表明 Gemma 4 新增了音頻支持,并且使用的是USM conformer encoder

2)OpenAI 音頻 API 支持與能力檢測

更新內容:

  • ?gemma4: add OpenAI audio API support and capability detection

這說明本次版本已經加入了OpenAI 音頻 API 支持,并且還包含capability detection,也就是能力檢測機制。

3)音頻輸入支持

更新內容:

  • ?gemma4: add audio input support for run command

這意味著在 run 命令中已經支持音頻輸入。

4)新增轉寫命令

更新內容:

  • ?gemma4: add transcribe command (ollama transcribe MODEL)

這次新增了一個轉寫命令:

ollama transcribe MODEL

這對于音頻轉文字場景非常直接,命令形式也很清晰。

5)增加 OpenAI 音頻轉寫 API 和 input_audio 支持

更新內容:

  • ?gemma4: add OpenAI audio transcription API and input_audio support

這進一步完善了音頻能力,不僅是輸入和轉寫,還補充了與 OpenAI 音頻轉寫 API 相關的支持,以及 input_audio 能力。

6)音頻輸入改為 dropped file attachments

更新內容:

  • ?cmd: simplify audio input to dropped file attachments

這說明音頻輸入在命令層面被簡化為dropped file attachments,使用方式更直接。

從這一組更新可以看出,v0.20.0 在音頻方向完成了從輸入、轉寫、API 到命令行體驗的一整套補強。

七、Gemma 4 解析、渲染與集成測試支持

本次更新還有一組圍繞 Gemma 4 的基礎設施改進:

  • ?gemma4: add parser, renderer, and integration test plumbing

這說明已經加入了parser、renderer、integration test plumbing
也就是說,Gemma 4 在解析、渲染以及集成測試方面的配套設施已經補上。

1)渲染器修復:輸出 BOS token

  • ?gemma4: fix renderer to emit BOS token

這是一個非常具體的修復,說明 renderer 現在會正確輸出BOS token

2)渲染器重寫:與 HF Jinja2 模板完全一致

  • ?gemma4: rewrite renderer to match HF Jinja2 template exactly

這說明渲染器被重寫,以確保與 HF Jinja2 模板保持完全一致。

這個變化通常意味著模型輸入模板的行為會更加標準化,減少模板差異帶來的結果偏差。

八、MoE 相關增強與修復

Gemma 4 的 26B 版本是 MoE 模型,因此 MoE 相關改動非常關鍵。

1)為 MoE router 增加 per_expert_scale,并修復 moe_intermediate 問題

更新內容:

  • ?gemma4: add per_expert_scale to MoE router and fix moe_intermediate_s…

雖然后半部分在記錄中被截斷,但已經明確看到兩個重點:

  • ? 為 MoE router 增加per_expert_scale

  • ? 修復moe_intermediate_s...相關問題

2)修復 MoE fused gate_up split 和 multiline tool-call arg parsing

更新內容:

  • ?gemma4: fix MoE fused gate_up split and multiline tool-call arg parsing

這說明本次對 MoE 的 fused gate_up split 做了修復,同時還修復了multiline tool-call arg parsing

3)MoE block 字段對齊格式調整

更新內容:

  • ?Format Gemma4 MoE block field alignment

這是一個格式層面的整理,說明 Gemma4 MoE block 的字段對齊做了統一和規范化。

從這些信息可以看出,Gemma 4 的 MoE 版本在結構、解析、格式與計算路徑方面都做了較完整的修復和優化。

九、視覺測試與 thinking 測試增強

更新中還有測試相關增強:

  • ?integration: improve vision test robustness and add thinking tests

這表示集成測試進一步增強了視覺測試的穩定性,同時新增了 thinking tests。
從結果上看,這類更新主要是為了提升整體驗證能力,讓新版本在視覺相關場景和推理相關場景下更加可靠。

十、Gemma 4 音頻測試與 OpenAI API 覆蓋

音頻相關不僅有能力支持,也同步加入了測試覆蓋:

  • ?integration: add gemma4 audio tests including OpenAI API coverage

這說明本次版本已經加入了 Gemma 4 音頻測試,并且包括 OpenAI API 的覆蓋。
這和前面音頻能力的增強是相互呼應的,說明該版本并不是只做了功能接入,也同步補齊了對應驗證。

十一、Gemma 4 視覺模型注釋與字段格式調整

更新記錄中還有一些針對模型結構和代碼可讀性的整理:

  • ?Remove redundant comments in gemma4 vision model

  • ?Format Gemma4 MoE block field alignment

前者表示移除了 Gemma 4 視覺模型中的冗余注釋。
后者則對 Gemma4 MoE block 的字段對齊格式進行了調整。

這類更新雖然看起來偏細節,但對于代碼維護、結構統一和后續協作非常重要。

十二、內存緩存與推理緩存優化

本次更新里還有一項和緩存相關的改動:

  • ?use 4096 kvcache.NewSWAMemCache

  • ?gemma4: use full SWA memory for better cache reuse

這說明緩存機制做了調整:

  • ? 使用了4096 kvcache.NewSWAMemCache

  • ? 同時使用full SWA memory來獲得更好的 cache reuse

這類優化通常和推理效率、上下文緩存復用體驗有關,是底層能力增強的一部分。

十三、Gemma 4 clamps 初始化與后端加載修復

更新記錄中還有:

  • ?gemma4: initialize clamps after backend load

這表示 clamps 的初始化時機調整到了 backend load 之后。
從描述來看,這是一個初始化順序上的修復,用于保證加載流程更穩定。

十四、Gemma 4 GGML 改進合并

更新記錄最后還有一個重要的合并信息:

  • ?Merge pull request from gemma4-ggml-improvements

這說明本次版本把 Gemma 4 的 GGML 改進進行了合并,和前面提到的 GGML model support、converter 更新等內容形成閉環。

十五、本次 v0.20.0 更新總結

整體來看,ollama v0.20.0 這次更新可以概括為幾個核心方向:

  1. 1.Gemma 4 正式上線

  • ? 提供了 E2B、E4B、26B、31B 多種規格

  • ? 支持 GGML 模型

2.音頻能力全面增強

  • ? 支持音頻輸入

  • ? 新增轉寫命令

  • ? 增加 OpenAI 音頻 API 與 transcription API 支持

  • ? 支持 input_audio

  • ? 簡化音頻輸入方式

3.Tokenizer 和模板能力增強

  • ? 增加 SentencePiece-style BPE 支持

  • ? pipeline 尊重 add_bos_token

  • ? renderer 重寫并修復 BOS token 輸出

4.MoE 與推理路徑優化

  • ? 增加 per_expert_scale

  • ? 修復 MoE 相關問題

  • ? 調整字段格式和分裂邏輯

  • ? 改進緩存復用

5.測試與工程能力增強

  • ? 視覺測試穩定性提升

  • ? 新增 thinking tests

  • ? 補充 Gemma 4 音頻測試與 OpenAI API 覆蓋


我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
程序員哭泣:被阿里裁員3年了,收入巔峰永遠停在2022年了,125萬

程序員哭泣:被阿里裁員3年了,收入巔峰永遠停在2022年了,125萬

黯泉
2026-04-08 20:26:04
特朗普被問戰爭罪當場破防,紐約時報反嗆:你當年還夸我們準

特朗普被問戰爭罪當場破防,紐約時報反嗆:你當年還夸我們準

熱搜摘要官
2026-04-08 08:10:57
000638,年內42個跌停板,股價首次跌破面值

000638,年內42個跌停板,股價首次跌破面值

數據寶
2026-04-09 16:23:53
中美印耕地面積對比:美國25億畝,印度24億畝,中國多少畝?

中美印耕地面積對比:美國25億畝,印度24億畝,中國多少畝?

云景侃記
2026-04-04 22:24:20
老師給外籍小朋友剝蝦視頻瘋傳,評論區罵慘了,怒斥:枉為人師

老師給外籍小朋友剝蝦視頻瘋傳,評論區罵慘了,怒斥:枉為人師

談史論天地
2026-04-09 08:46:08
MVP爭奪戰驚天反轉:規則殺死了最偉大的賽季

MVP爭奪戰驚天反轉:規則殺死了最偉大的賽季

茅塞盾開本尊
2026-04-09 12:36:38
中國肺癌發病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
NASA發布“最清晰的月球照片”,地球無法觀察的月背:細節滿滿

NASA發布“最清晰的月球照片”,地球無法觀察的月背:細節滿滿

環球科學貓
2026-04-09 13:11:52
長沙頻繁下雨衣柜都“發霉”了,專家:霉菌毒性是砒霜的68倍,收好這份除霉秘訣

長沙頻繁下雨衣柜都“發霉”了,專家:霉菌毒性是砒霜的68倍,收好這份除霉秘訣

瀟湘晨報
2026-04-08 21:25:15
以色列阻止美伊談判未果,特朗普想盡快退出,而以色列想繼續

以色列阻止美伊談判未果,特朗普想盡快退出,而以色列想繼續

山河路口
2026-04-09 17:45:55
鬧大了!全紅嬋報警后續:央視下場,鐵證曝光,群解散但人跑不掉

鬧大了!全紅嬋報警后續:央視下場,鐵證曝光,群解散但人跑不掉

米果說識
2026-04-09 17:18:41
已飛行250億公里!最遠飛船傳回的最后一張照片,顛覆人類的認知

已飛行250億公里!最遠飛船傳回的最后一張照片,顛覆人類的認知

老黯談娛
2026-04-09 10:04:23
馬筱梅不忍了!張蘭生日第二天,連發好幾條澄清,局面很難扭轉

馬筱梅不忍了!張蘭生日第二天,連發好幾條澄清,局面很難扭轉

離離言幾許
2026-04-09 00:04:01
70歲大媽的罕見養老法:不麻煩子女不再婚,不去養老院不請保姆

70歲大媽的罕見養老法:不麻煩子女不再婚,不去養老院不請保姆

熱心柚子姐姐
2026-04-08 16:42:35
6歲女童遇害:家屬含淚爆作案動機,兇手被抓后冷靜異常,太憤怒

6歲女童遇害:家屬含淚爆作案動機,兇手被抓后冷靜異常,太憤怒

眼光很亮
2026-04-07 11:38:00
趁火打劫!狼隊如降級或送曼聯豪禮,紅魔有望迎來卡塞米羅接班人

趁火打劫!狼隊如降級或送曼聯豪禮,紅魔有望迎來卡塞米羅接班人

體壇鑒春秋
2026-04-09 12:34:23
折疊屏賽道風向突變!安卓廠商扎堆跟進闊折疊:紛紛對標蘋果

折疊屏賽道風向突變!安卓廠商扎堆跟進闊折疊:紛紛對標蘋果

快科技
2026-04-09 17:41:16
樊振東放棄世乒賽原因曝光!再收3好1壞消息,王楚欽冰火兩重天!

樊振東放棄世乒賽原因曝光!再收3好1壞消息,王楚欽冰火兩重天!

曹說體育
2026-04-09 14:01:45
參觀洋山港后,鄭麗文一句話,向大陸示好,賴清德要氣炸了

參觀洋山港后,鄭麗文一句話,向大陸示好,賴清德要氣炸了

天氣觀察站
2026-04-09 17:20:23
好干凈的女子,膀大腰圓,眉清目秀,膚白貌美,氣質絕!

好干凈的女子,膀大腰圓,眉清目秀,膚白貌美,氣質絕!

手工制作阿殲
2026-04-09 07:42:48
2026-04-09 19:12:49
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1172文章數 63關注度
往期回顧 全部

科技要聞

Meta凌晨首發閉源大模型 扎克伯格又行了?

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業稱出于好心

頭條要聞

一群人闖進女子剛買的新房砸了兩面墻 物業稱出于好心

體育要聞

8萬人面前心臟驟停 現在他還站在球場上

娛樂要聞

金莎官宣結婚 與老公孫丞瀟相差18歲

財經要聞

停火首日,霍爾木茲僅有4艘船通過

汽車要聞

文飛的回歸 給神行者帶來什么?

態度原創

教育
游戲
家居
時尚
房產

教育要聞

被嚴重低估!全市唯一有招生代碼的公辦高中國際部

Xbox系統迎核彈級更新!讓微軟女總裁"俘獲"玩家芳心

家居要聞

清新自然 復古風尚

ED網紅病,正在掏空年輕女性

房產要聞

利潤暴跌44%!那個春節被罵慘了的海峽股份 正在經歷什么?

無障礙瀏覽 進入關懷版