337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

GLM-Image開源:原創架構、國產芯片訓練、擅長漢字生成

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區,始終堅持“中立、開放、共建、共創、合作”五項基本原則,歡迎加入共同成長。


智譜聯合華為開源新一代圖像生成模型GLM-Image,模型基于昇騰Atlas 800T A2設備和昇思MindSpore AI框架完成從數據到訓練的全流程,是首個在國產芯片上完成全程訓練的SOTA多模態模型。GLM-Image已經發布在始智AI wisemodel開源社區,歡迎大家前往嘗試。


模型地址

https://wisemodel.cn/models/ZhipuAI/GLM-Image

GLM-Image采用自主創新的「自回歸+擴散解碼器」混合架構,實現了圖像生成與語言模型的聯合,是我們面向以Nano Banana Pro為代表的新一代「認知型生成」技術范式的一次重要探索。

核心亮點如下:

  • 架構革新,面向「認知型生成」的技術探索:采用創新的「自回歸 + 擴散編碼器」混合架構,兼顧全局指令理解與局部細節刻畫,克服了海報、PPT、科普圖等知識密集型場景生成難題,向探索以Nano Banana Pro為代表的新一代“知識+推理”的認知型生成模型邁出了重要一步。

  • 首個在國產芯片完成全程訓練的SOTA模型:模型自回歸結構基座基于昇騰Atlas 800T A2設備與昇思MindSpore AI框架,完成了從數據預處理到大規模訓練的全流程構建,驗證了在國產全棧算力底座上訓練前沿模型的可行性。

  • 文字渲染開源SOTA:在CVTG-2K(復雜視覺文本生成)和LongText-Bench(長文本渲染)榜單獲得開源第一,尤其擅長漢字生成任務。

  • 高性價比與速度優化:API調用模式下,生成一張圖片僅需0.1元,速度優化版本即將更新。

01.

架構創新:讀懂指令,寫對文字

近期,以Nano Banana Pro為代表的閉源圖像生成模型正在推動圖像生成與大語言模型的深度融合。技術范式正從單一的圖像生成,進化為兼具世界知識與推理能力的「認知型生成」。這些模型在海報、PPT、科普圖等知識密集型場景及高保真細節呈現上表現驚艷,展現了這一技術范式的優勢。

GLM-Image正是面向「認知型生成」技術范式一次重要探索。這是首個開源的工業表現級離散自回歸圖像生成模型,希望借此與開源社區分享我們在這一前沿方向的技術路徑與實踐思考。

  • 創新架構讓模型讀懂寫對:面對傳統模型在“理解復雜指令”與“精準繪制文字”上難以兼顧的問題,GLM-Image 引入了「自回歸+擴散解碼器」混合架構,創新地融合了9B大小的自回歸模型與7B大小的DiT擴散解碼器。前者利用其語言模型的底座優勢,專注于提升對指令的語義理解和畫面的全局構圖;后者配合Glyph Encoder的文本編碼器,專注于還原圖像的高頻細節和文字筆畫,以此改善模型“提筆忘字”的現象。

  • 多分辨率自適應:通過改進Tokenizer策略,GLM-Image能夠自適應處理多種分辨率,原生支持從1024x1024到2048×2048尺寸的任意比例圖像的生成任務,無需重新訓練。


通用pipeline


解碼器結構示意圖

GLM-Image技術報告:https://z.ai/blog/glm-image

02.

開源SOTA:更擅長文字密集生成任務

基于上述架構創新,GLM-Image在文字渲染的權威榜單中達到開源SOTA水平。



  • CVTG-2K(復雜視覺文字生成)榜單核心考察模型在圖像中同時生成多處文字的準確性。在多區域文字生成準確率上,GLM-Image憑借0.9116的Word Accuracy(文字準確率)成績,位列開源模型第一。在NED(歸一化編輯距離)指標上,GLM-Image同樣以0.9557領先,表明其生成的文字與目標文字高度一致,錯字、漏字情況更少。

  • LongText-Bench(長文本渲染)榜單考察模型渲染長文本、多行文字的準確性,覆蓋招牌、海報、PPT、對話框等8種文字密集場景,并分設中英雙語測試,GLM-Image以英文0.952、中文0.979的成績位列開源模型第一。

03.

首個國產芯片訓練出的SOTA模型

GLM-Image是我們對國產計算生態的一次深度探索與驗證。其自回歸結構基座從早期的數據預處理到最終的大規模預訓練,全流程均在昇騰Atlas 800T A2設備上完成。

依托昇騰NPU和昇思MindSpore AI框架,使用動態圖多級流水下發、高性能融合算子、多流并行等特性,我們自研了模型訓練套件,全面優化數據預處理、預訓練、SFT和RL的端到端流程。通過動態圖的多級流水優化機制,將Host側算子下發的關鍵階段流水化并高度重疊,消除下發瓶頸;通過多流并行策略,通信和計算互掩,打破文本梯度同步、圖像特征廣播等操作的通信墻,極致優化性能;使用AdamW EMA、COC、RMS Norm等昇騰親和的高性能融合算子,同步提升訓練的穩定性和性能。

GLM-Image是首個在國產芯片上完成全流程訓練的SOTA多模態模型,驗證了在國產全棧算力底座上訓練高性能多模態生成模型的可行性。我們希望這一實踐能為社區挖掘國產算力潛力提供有價值的參考。

04.

實測案例

下面來看看GLM-Image在實際的復雜圖文任務中的表現。

場景一:科普插畫

GLM-Image 更擅長繪制包含復雜邏輯流程與文字說明的科普插畫及原理示意圖。


場景二:多格圖畫

在生成電商圖、漫畫等多格圖畫時,GLM-Image能夠保持風格和主體的一致性,并保障多處文字生成的準確率。


場景三:社交媒體圖文封面

GLM-Image 適用于制作社交媒體封面及內容等排版復雜的圖片,讓您的創作更自由豐富。


場景四:商業海報

GLM-Image 能夠生成構圖富有設計感、文字嵌入準確的節日海報與商業宣傳圖。


場景五:寫實攝影

在文字渲染以外,GLM-Image也同樣擅長生成各種景別和尺寸的人像、寵物、風景、靜物。


最后,用GLM-Image生成的一張圖總結一下模型的核心要點。


----- END -----


wisemodel相關:

系列模型:


關于wisemodel更多


1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
張雪峰好兄弟曝內情泣不成聲,人民日報悼念官媒定義,衛健委追責

張雪峰好兄弟曝內情泣不成聲,人民日報悼念官媒定義,衛健委追責

潮鹿逐夢
2026-03-26 10:55:41
“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

安安說
2026-03-14 18:50:59
受權發布|中華人民共和國國務院令  第833號

受權發布|中華人民共和國國務院令  第833號

新華社
2026-03-26 17:03:04
被成龍“泡過”的三位女星,個個性感迷人,其中一位火遍全國

被成龍“泡過”的三位女星,個個性感迷人,其中一位火遍全國

阿鳧愛吐槽
2026-03-23 14:07:43
400網約車與一被剪斷的線:誰在給重慶人的屁股底下安“炸彈”?

400網約車與一被剪斷的線:誰在給重慶人的屁股底下安“炸彈”?

有戲
2026-03-18 09:57:23
上海電影院現場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

上海電影院現場被捉奸,帶情夫當老公面出軌,狗血女主角真容曝光

靜若梨花
2026-03-01 16:25:46
事情鬧大了,日本內閣連發公告,中國的態度,告訴了世界一個事實

事情鬧大了,日本內閣連發公告,中國的態度,告訴了世界一個事實

探源歷史
2026-03-27 12:34:02
特朗普否認急于達成協議 稱對伊朗軍事行動繼續

特朗普否認急于達成協議 稱對伊朗軍事行動繼續

財聯社
2026-03-27 05:29:07
加拿大宣布對伊朗實施新制裁

加拿大宣布對伊朗實施新制裁

每日經濟新聞
2026-03-27 08:32:12
惡心到家了!《逐玉》大結局,是我今年看過“最離譜的大結局”!

惡心到家了!《逐玉》大結局,是我今年看過“最離譜的大結局”!

離離言幾許
2026-03-27 11:25:18
1986年韓先楚拒絕葬在八寶山,他對陳云說:那里有我不愿見到的人

1986年韓先楚拒絕葬在八寶山,他對陳云說:那里有我不愿見到的人

百年歷史老號
2026-03-25 18:27:41
繼張雪峰之后,中醫大師黃貴華被曝心梗去世,社交賬號已變黑白

繼張雪峰之后,中醫大師黃貴華被曝心梗去世,社交賬號已變黑白

180視角
2026-03-26 11:52:12
歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
鴻蒙智行電池技術負責人:為延長電池壽命 我們把華為化學家、數學家都投入了進來

鴻蒙智行電池技術負責人:為延長電池壽命 我們把華為化學家、數學家都投入了進來

快科技
2026-03-27 15:22:06
自作自受!瘋狂甩賣球員,導致主場空空蕩蕩,觀眾寥寥無幾

自作自受!瘋狂甩賣球員,導致主場空空蕩蕩,觀眾寥寥無幾

體育哲人
2026-03-27 13:43:42
CBA最新消息!焦泊喬離開廣東宏遠,山東男籃換掉克里斯

CBA最新消息!焦泊喬離開廣東宏遠,山東男籃換掉克里斯

體壇瞎白話
2026-03-27 14:55:54
外媒:扎哈羅娃警告稱,俄將嚴厲回應西方國家針對有關船只采取的不友好行為

外媒:扎哈羅娃警告稱,俄將嚴厲回應西方國家針對有關船只采取的不友好行為

環球網資訊
2026-03-26 18:05:41
你永遠想不到醫院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

你永遠想不到醫院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

另子維愛讀史
2026-01-22 18:21:09
一夜暴跌25%!小馬哥最怕的事還是發生了:年輕人正在從騰訊溜走

一夜暴跌25%!小馬哥最怕的事還是發生了:年輕人正在從騰訊溜走

潮鹿逐夢
2026-03-21 11:54:42
美國:謀劃“致命一擊”,考慮向中東增派萬人部隊!伊朗動員百萬兵力,準備與美國進行地面作戰!伊朗或開辟新戰線,胡塞武裝:已做好準備

美國:謀劃“致命一擊”,考慮向中東增派萬人部隊!伊朗動員百萬兵力,準備與美國進行地面作戰!伊朗或開辟新戰線,胡塞武裝:已做好準備

每日經濟新聞
2026-03-27 12:02:13
2026-03-27 18:39:00
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

體育要聞

邵佳一:足球就像一場馬拉松

娛樂要聞

張雪峰靈堂內景曝光,四周擺滿了鮮花

財經要聞

我在小吃培訓機構學習“科技與狠活”

汽車要聞

與眾08,金標大眾不能輸的一戰

態度原創

手機
游戲
家居
數碼
軍事航空

手機要聞

消息稱某廠新機測試2K+185Hz顯示屏,預計為榮耀

科樂美旗下電競學院新增學科 培育網絡直播人材

家居要聞

曲線華爾茲 現代簡約

數碼要聞

華碩ROG幻世神Cronox機箱開啟預約:配備9.2"副屏,2399元

軍事要聞

伊朗:已組織超100萬人為地面戰斗做準備

無障礙瀏覽 進入關懷版