網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

慢一點、深一點｜藏師傅帶你看清 Gemini3 真實實力

2025-11-19 16:08:38　來源: 歸藏的AI工具箱

北京舉報

分享至

從昨晚到早上大家應該看了很多 Gemini 3 的相關信息了，藏師傅這里就不廢話了。

簡單說一下它有多強，從測試基準來看直接在幾乎所有基準上都達到了 SOTA，同時相當一部分大幅領先第二名，當然除了 SWE-Bench 這個。

用來驗證 AI 是否脫離了“概率模仿”并開始產(chǎn)生“真正思考”的測試集 ARC-AGI v2 的得分上，甚至超過了現(xiàn)在最強模型的兩倍以上，看看 Gemini 3 孤零零在的位置。

從昨晚發(fā)布開始我就用 Gemini 3 做了相當多的測試。

同時測試內(nèi)容依舊秉承藏師傅一貫的觀點，除了測試能力以外也盡可能都是對大家有用的。

我也會開放這些提示詞，由于谷歌一貫的財大氣粗，所以你幾乎在 AI Studio 和谷歌新發(fā)布的 AI IDE Antigravity上可以免費用 Gemini 3，只有你自己的看法才是最客觀的，建議多試試。

Gemini 剛發(fā)布的時候我最關注的還是多模態(tài)的理解能力，畢竟這個一直是谷歌的看家本事，先拿了兩個視頻試了一下。

第一個是 AI 藝術家 852話做的 AI MV 視頻，里面有相當多的快閃效果，分鏡變化也很頻繁，非常適合用來分析模型對于視頻細節(jié)的分析能力。

提示詞是：幫我詳細分析這個視頻的每個分鏡內(nèi)容，確保我可以讓設計師復刻它

可以看到他幾乎按每秒鐘說了每個動畫效果表現(xiàn)的細節(jié)和畫面主體內(nèi)容，前面加上了總的風格描述，最后加上了如果要用 AE 做的話用哪些插件才行，非常細了。

接下來剛好要發(fā)谷歌新發(fā)布的 AI IDE 的介紹，索性直接把他們的宣傳視頻扔給了 Gemini 3，讓他幫我總結。

整體非常有條理，產(chǎn)品的核心定位、宣傳主題以及產(chǎn)品的詳細功能都分析到了，我直接就發(fā)了，結果數(shù)據(jù)還行。

提示詞為：幫我詳細總結視頻內(nèi)容，介紹這個產(chǎn)品。

然后就來到了我們的重頭戲，編碼能力上，現(xiàn)在 AI Studio 里面的 Build 模式是真的頂，居然生成的網(wǎng)頁也可以直接調(diào)用谷歌所有 AI 能力。

于是就想能不能讓他幫我直接實現(xiàn)一個設計 Agent 產(chǎn)品，可以幫我思考設計方案，完善之后自己寫提示詞作圖。

提示詞：幫我實現(xiàn)一個功能完整的視頻和圖片Agent 平臺，支持自主完成圖像編輯和設計任務

沒想到真的可以，支持對話，他詳細詢問你的需求，然后幫你用 Nano 生成設計圖，真的一句話一次就搞定了，我甚至沒說什么是設計 Agent 以及應該如何實現(xiàn)這些能力。

這個 Logo 設計圖和基于 Logo 設計的月餅包裝袋都是它幫忙設計的，以前哪敢想啊，朋友們，需求和實現(xiàn)方案都不管，一句話需求，說句不好聽的，實習生肯定搞不定。

然后我們來試一下 Gemini 3 的設計稿還原能力。

我找了一張自己收藏夾里相對復雜的設計圖，里面細節(jié)挺多的，讓他完美還原這個設計稿，圖片可以用占位圖。

沒想到直出效果這么好，尤其是頭部這部分的排版細節(jié)，比如字號、字體顏色以及行間距等。

而且右邊那本書他找不到圖片，直接自己用代碼寫了一本，還補全了設計稿中不存在的的內(nèi)容。

昨天有朋友說，這個細節(jié)還是有問題，我還開玩笑說，沒 AI 的時候一些大廠程序員拿著 figma 設計稿第一版能做到這個水平，我就已經(jīng)燒高香了。

然后我就想，圖片 Agent 做了，那要不整一個視頻 Agent？

但是 AI Studio 里面沒有內(nèi)置 Veo 3.1 視頻模型，于是我就到 Youware 用 Gemini 3 試了一下，也是簡單說了一下。

提示詞：幫我做一個設計 Agent 網(wǎng)頁工具，它可以幫我自動地迭代和優(yōu)化，并且生成設計圖和設計視頻，調(diào)用所有相關的設計 AI API。

第一次他生成的視頻只有一個分鏡，于是又讓他加了多個分鏡編排的能力，讓他調(diào)用 LLM 生成提示詞和劇本。

然后搞定了，真離譜啊，選擇故事模式后他會自己生成劇本以及每個分鏡的提示詞然后調(diào)用 Veo 生成多段視頻。

然后我才反應過來，我這不是做了一個 Krea 那種 AI 聚合應用嗎，基本功能都有了，于是直接把 Krea 的界面截圖扔給他，連界面也復刻了，哈哈。

早上起來刷到一個，那種宣傳產(chǎn)品功能的用 AE 做的快閃動畫，然后就想這里面都是前端界面的元素嗎，能不能讓 Gemini 3 用代碼給我整一個。

整理了一下提示詞之后，他還真的整了一個出來，現(xiàn)在會以之前非常流行的滾動敘事網(wǎng)頁的形式表現(xiàn)，如果你想做自己的產(chǎn)品網(wǎng)站的話可以參考這個提示詞，還是很吸睛的。

Gemini 3 滾動敘事網(wǎng)頁生成提示詞：

請你扮演一位擅長創(chuàng)意交互的前端開發(fā)專家。我要做一個類似 Apple 產(chǎn)品頁風格的“Scrollytelling（滾動敘事）”網(wǎng)頁 Demo。

技術棧要求：

使用 HTML、CSS 和 GSAP (GreenSock) 配合 ScrollTrigger 插件。

交互邏輯：

頁面高度要設置得很長（如 5000px），建立一個全屏固定的視口（Pinned Container）。用戶的滾動動作不移動頁面，而是作為進度條（Scrub: 1）直接控制整個動畫的時間軸播放。

視覺與動畫流程（請按順序實現(xiàn)以下 Timeline）：

開場：屏幕中心只有簡潔的文字 Slogan，隨著滾動，文字放大并漸隱消失。

UI 演示：隨后，模擬“手機通知彈窗”和“郵件列表卡片”從不同方向平滑飛入屏幕中心。

堆疊特效：繼續(xù)滾動，這些分散的卡片要通過 3D 變換，自動吸附堆疊在一起（Stacking Effect）。

高潮：出現(xiàn)一個“Unsubscribe All”的按鈕，當滾動經(jīng)過它時，堆疊的所有卡片瞬間向四周炸開/飛走（Explosion Effect）。

結尾：露出最后的 Logo。

風格要求：

極簡主義、圓角卡片設計、陰影柔和、動畫曲線要非常有彈性（Elastic/Spring）。請直接給我可運行的完整代碼文件

從三秒開始的動畫真的很頂，這個3D 卡片的旋轉懸浮然后再排列整齊的動畫非常的流暢而且豐富。

而且美學表現(xiàn)也很強，標題的漸變色、描邊以及后面卡片的細節(jié)，你真的可以用這套邏輯讓 Gemini 幫你用前端寫一個宣傳視頻出來，這是一個很大的機會，可以填補目前的 AI 視頻模型做不了的部分。

上面的離譜嗎？還有更離譜的，早上看見朋友向陽喬木想用 Gemini 生成短劇點子，于是優(yōu)化了一下，看看能不能讓 Gemini 3 直接生成互動式游戲。

沒想到在 AI Studio 里面簡單調(diào)整了兩次就搞定了，Gemini 3 會根據(jù)你提供的文本生成互動式游戲，很像 GalaGame 常見的形式。

區(qū)別就是里面所有的素材都是隨著劇情的推進實時生成的，包括：對話文案、語音對話、人物頭像、畫面背景以及章節(jié)信息。

上面這是個很好的機會，人人只要有好劇本會打字就可以做互動內(nèi)容和互動游戲，再搭配蘋果前幾天給類似小程序這種產(chǎn)品松綁和降低分成，里面可能醞釀著一個新的頂級內(nèi)容消費平臺的機會。

你用下面這個提示詞在 AI Studio 里面的 Build 模式可以直接生成類似游戲，記得在第四步把文案放進去，老板以后靠這個提示詞發(fā)財了，可千萬記得點我。

Gemini 3 互動漫劇生成提示詞：

Act as a World-Class Frontend Engineer and UI/UX Designer.

Create a "High-Fidelity Interactive Visual Novel" web application using React (es6 modules), Tailwind CSS, and the Google Gemini API (@google/genai).

1. Design Philosophy & UI Style (Crucial)

The UI must strictly follow a "Japanese Commercial Galgame (Visual Novel)" aesthetic.

Vibe: Dark Fantasy, Cyberpunk, Polish, High-End.
Art Style for AI Generation: Enforce "Japanese Celluloid Anime Style (賽洛魯/平涂)" for all generated images.
Dialogue Box: NOT a simple rectangle. It must feature:
- A "Glassmorphism" background (dark, blurred).
- Decorative Tech/Fantasy borders (double lines, glowing neon accents in Cyan/Gold).
- A dedicated, stylized "Nameplate" attached to the top-left of the box.
- A large, rectangular Character Avatar (3:4 ratio) on the left side with a decorative frame.
Typography: Clean, readable serif or sans-serif with typing writer effects.
Animations: Smooth fade-ins for backgrounds/characters, shake effects for intense scenes, flash effects for combat.

2. Core Features

1.Story Engine: Iterate through a predefined script (I will provide the story content below).
2.AI Image Generation (Gemini Nano/Flash):
- Backgrounds: Automatically generate scene backgrounds based on the current plot location using gemini-2.5-flash-image.
- Character Tachie (Portraits): Automatically generate character standees. Apply a "Card" style frame (rounded corners, inner shadow, border) so they look like polished assets, not raw photos.
- Prompt Engineering: Automatically append "Japanese Celluloid Anime Style, masterpiece, flat color" to all image prompts to ensure consistency.
3.Text-to-Speech (TTS): Use the Web Speech API to read dialogue. Assign different pitch/rate to different characters (e.g., Deep/Slow for the Monster, Normal for the Protagonist).
4.Gemini Insight: A button to analyze the current scene's sentiment and lore using gemini-2.5-flash.

3. Data Structure

Use a constant file to store the Story Script.
Define Characters with properties: id, name, visualDescription (for AI generation), voicePitch, voiceRate.
Define Backgrounds with properties: type, visualDescription.

4. Story Content (The Novel)

Please parse the following novel content into the structured script.

[在此處粘貼你的小說正文內(nèi)容]

5. Technical Requirements

Use process.env.API_KEY for Gemini.
Handle async image generation gracefully (show a "Generating..." loader in the UI).
Single file structure preferred or standard modular structure (App, components, services).
Ensure the layout is responsive but optimized for Landscape viewing.

Generate the complete code now.

最后是一個很好玩的案例，可以同時表現(xiàn) Gemini 3 的多模態(tài)能力以及代碼能力，它可以直接從一張圖片幫你生成 3D 的體素圖像動畫，還原度很高。

提示詞：I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page

剛好刷到一個很好看的賽博風格圣誕樹圖片就扔個 Gemini 3 了。

沒想到它這么懂，帶縮放動畫的星星、閃光特效和旋轉的點狀發(fā)光絲帶，給整個動畫增加了非常多的表現(xiàn)力。順便用這玩意提前祝大家圣誕快樂了。

好了這期內(nèi)容就這樣了，希望這些玩法和測試能給你帶來一些啟發(fā)。

DeepMind 的人說今晚還有大的，不知道是不是昨天試的 Nano Banana Pro 模型，谷歌怕不是要熬死我們這幫人。

如果你覺得這些內(nèi)容對你有幫助的話，可以幫我點個贊或者，也可以轉發(fā)??給你需要的朋友們，我們評論區(qū)見。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.