![]()
作者丨子墨
北京時間2026年2月27日凌晨,谷歌發布了最新圖像模型Nano Banana 2(以下簡稱NB 2),隨后立即在Artificial Analysis文生圖榜單上登頂,迅速引起行業熱議。
![]()
(2026.2.27 Artificial Analysis文生圖榜單排名情況)
Nano Banana自2025年8月上線至今,正好半年時間,已經經歷了3個版本,3個月更新一次,且每個版本都在之前的基礎上有了更強的AI屬性。
比如NB Pro版增加了思考模式;NB 2則在生成的速度與質量上有了進一步升級,更加突出“極速”和“一致性”概念,同時這也是Nano Banana首次在Flash極速系列模型中原生支持4K輸出(Pro系列雖然也支持4K,但其更注重于深度推理,生成速度通常比Flash慢)。
![]()
(Nano Banana系列模型全景圖,由Gemini生成)
生成速度與圖像畫質一直是行業亟待突破的核心痛點,NB 2究竟實現了哪些關鍵升級?又將為市場開辟出怎樣的新方向與新可能?
聯網搜索,還原“窗外”真實場景
首先,可以看到在NB 2的主頁面中增加了各種參考風格模板,這是之前的版本中沒有的。而且這些圖并不是那種傳統的,像如二次元、像素風、電影寫真一樣的分類,而是一種更具設計感、藝術感,帶有情感且更具象化的表述,比如哥特式粘土、超現實主義、老動畫片、神話戰士等等,在初始階段就為用戶提供了設計靈感。
![]()
(Nano Banana 2主頁參考模板圖)
這里,筆者選取了“Moody(憂郁情緒)”參考圖作為生成模板,以“少女坐在窗邊,側臉安靜憂郁,眼神放空,被日常瑣事困擾而情緒低落,柔和側光,簡約房間,安靜孤獨的氛圍,電影質感,低飽和度,細膩唯美,治愈系插畫。”為提示詞,生成了下面這張圖。總耗時約20秒,速度比之前的Pro版本快了一些。
![]()
可以看出,整體畫面除了有較強的電影質感外,“窗外”的風景是非常寫實的,圖中的車輛、電線桿等元素,是符合女孩視角下“近大遠小”邏輯的。這是NB 2在模型上相較于之前的一個細節方面的提升。它能夠通過網絡搜索來獲取圖像,以真實世界的景象作為參考,進而創造出更加細節、寫實的視覺效果。
在谷歌的官方示例中,也對“窗邊座位”場景進行了展示。NB 2能夠結合知識儲備與網絡檢索,根據全球各地的實時天氣數據,生成更加逼真的窗外風景。
![]()
(Nano Banana 2官方示例,圖源:谷歌)
一致性升級,連載創作不再“跑偏”?
其次,NB 2在“一致性”方面做了升級。在之前的版本中,同一個工作流內,對多角色或物體圖片進行多次修改時,一些物體變模糊或扭曲,角色面部會出現變形等情況,這也是大部分模型都面臨的痛點問題。
而在NB 2則能夠在同一個工作流中保持多達5個角色、14個物體的一致性。這意味著,用戶可以跨多場景、鏡頭展示內容,十分適合于分鏡制作或連載創作。
而這種能力的提升也在于NB 2從Pro模型中引入的強推理能力和更嚴格的指令遵循。一方面,模型能夠通過初始的提示詞為每個角色定義獨特的物體特征,并在后續生成的圖片中識別并保留這些特定的內容,避免在修改環境或動作時,角色的形象發生改變。
另一方面,NB 2支持從512px到4K的多種分辨率和原生比例,在高精度的渲染下,確保了在復雜的視覺場景中,紋理、光照等細節在多次迭代中仍能保持穩定。
筆者用“6只寵物在不同場景下旅行”作為案例,進行了“一致性”測試。
初始提示詞為:3只貓、3只狗一起在熱帶海邊沙灘玩耍,藍天白云,清澈海水,夏日氛圍,每只寵物的品種有所差異,生動自然,高保真畫質。生成圖片如下:
![]()
二次修改提示詞為:這些寵物一起漫步在彩色童話小鎮,夢幻溫馨,可愛風格,每只寵物外形與之前保持一致,位置和動作有所變化,細節豐富,光線柔和。生成圖片如下:
![]()
三次修改提示詞為:這些寵物們仰望星空,銀河璀璨,氛圍感拉滿,每只寵物外觀保持一致,動作和位置有所變化,史詩級畫面,超寫實。生成圖片如下:
![]()
可以發現,在經歷了2次場景、寵物動作及位置變化后,最初的6只寵物變成了5只,但保留的這5只雖然視角、動作、位置有所變化,但形象始終是保持一致的。不過,圖片中場景的AI感還是比較強的,寵物與場景的融合度還有待提升,目前還是存在類似影視劇中的“摳圖感”。
圖像中的本地化,設計中的多場景
除了上述在生成質量和一致性方面的提升,NB 2還做了一些功能細節方面的優化,為有專業設計需求的人提供服務。
比如模型支持了圖像內容的本地化,即可直接在圖像中生成、翻譯多語言文字,同時模型也能理解并對畫面視覺內容進行本地化適配。這對于一些全球化的B端用戶來說,節省了不少重復修改的時間成本。
![]()
(Nano Banana 2多語言翻譯,圖源:谷歌)
此外,NB 2在原有生成圖像寬高比的基礎上,新增了4:1、1:4、8:1和1:8的比例,滿足更多元化的場景需求。比如4:1是非常典型的網頁橫幅尺寸,8:1則在地鐵、機場中極寬LED屏幕上較為常見。
百萬Token價格,直降50%
NB 2的多項升級或許需要更高頻使用才能深度感知,但價格卻是最直觀地顯現。它通過降低每百萬Token單價的方式,使生成成本相比之前的Pro版大幅降低。Pro版本的輸出單價為120美元/1M tokens,而NB 2僅為60美元,降幅達到50%。
且根據不同分辨率消耗不同的Token數量,相比于Pro版1K和2K統一價格,NB 2對低分辨率圖片的成本控制更優,特別是1K分辨率的圖片,價格相比之前降低了50%。
![]()
不同分辨率生成成本估算,圖表及數據均由Gemini生成
總的來說,NB 2的這次升級,核心在于提升了生成內容的一致性與響應速度。通過引入全網實時搜索,讓生成結果與現實世界的關聯更加緊密,并在本地化和多場景應用上有了更明確的布局。
從上線首日的反饋來看,用戶最直觀的感受是“快”。雖然在圖像精細度上,人們可能還沒察覺到顯著變化,但這次迭代為市場帶來了新的思路:速度與質量并非不可兼得。語義理解、推理能力以及實時搜索的加入,正在成為提升圖像質量的關鍵要素。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.