從昨晚到早上大家應該看了很多 Gemini 3 的相關信息了,藏師傅這里就不廢話了。
簡單說一下它有多強,從測試基準來看直接在幾乎所有基準上都達到了 SOTA,同時相當一部分大幅領先第二名,當然除了 SWE-Bench 這個。
用來驗證 AI 是否脫離了“概率模仿”并開始產(chǎn)生“真正思考”的測試集 ARC-AGI v2 的得分上,甚至超過了現(xiàn)在最強模型的兩倍以上,看看 Gemini 3 孤零零在的位置。
從昨晚發(fā)布開始我就用 Gemini 3 做了相當多的測試。
同時測試內(nèi)容依舊秉承藏師傅一貫的觀點,除了測試能力以外也盡可能都是對大家有用的。
我也會開放這些提示詞,由于谷歌一貫的財大氣粗,所以你幾乎在 AI Studio 和谷歌新發(fā)布的 AI IDE Antigravity上可以免費用 Gemini 3,只有你自己的看法才是最客觀的,建議多試試。
Gemini 剛發(fā)布的時候我最關注的還是多模態(tài)的理解能力,畢竟這個一直是谷歌的看家本事,先拿了兩個視頻試了一下。
第一個是 AI 藝術家 852話 做的 AI MV 視頻,里面有相當多的快閃效果,分鏡變化也很頻繁,非常適合用來分析模型對于視頻細節(jié)的分析能力。
提示詞是:幫我詳細分析這個視頻的每個分鏡內(nèi)容,確保我可以讓設計師復刻它
可以看到他幾乎按每秒鐘說了每個動畫效果表現(xiàn)的細節(jié)和畫面主體內(nèi)容,前面加上了總的風格描述,最后加上了如果要用 AE 做的話用哪些插件才行,非常細了。
接下來剛好要發(fā)谷歌新發(fā)布的 AI IDE 的介紹,索性直接把他們的宣傳視頻扔給了 Gemini 3,讓他幫我總結。
整體非常有條理,產(chǎn)品的核心定位、宣傳主題以及產(chǎn)品的詳細功能都分析到了,我直接就發(fā)了,結果數(shù)據(jù)還行。
提示詞為:幫我詳細總結視頻內(nèi)容,介紹這個產(chǎn)品。
然后就來到了我們的重頭戲,編碼能力上,現(xiàn)在 AI Studio 里面的 Build 模式是真的頂,居然生成的網(wǎng)頁也可以直接調(diào)用谷歌所有 AI 能力。
于是就想能不能讓他幫我直接實現(xiàn)一個設計 Agent 產(chǎn)品,可以幫我思考設計方案,完善之后自己寫提示詞作圖。
提示詞:幫我實現(xiàn)一個功能完整的視頻和圖片Agent 平臺,支持自主完成圖像編輯和設計任務
沒想到真的可以,支持對話,他詳細詢問你的需求,然后幫你用 Nano 生成設計圖,真的一句話一次就搞定了,我甚至沒說什么是設計 Agent 以及應該如何實現(xiàn)這些能力。
這個 Logo 設計圖和基于 Logo 設計的月餅包裝袋都是它幫忙設計的,以前哪敢想啊,朋友們,需求和實現(xiàn)方案都不管,一句話需求,說句不好聽的,實習生肯定搞不定。
然后我們來試一下 Gemini 3 的設計稿還原能力。
我找了一張自己收藏夾里相對復雜的設計圖,里面細節(jié)挺多的,讓他完美還原這個設計稿,圖片可以用占位圖。
沒想到直出效果這么好,尤其是頭部這部分的排版細節(jié),比如字號、字體顏色以及行間距等。
而且右邊那本書他找不到圖片,直接自己用代碼寫了一本,還補全了設計稿中不存在的的內(nèi)容。
昨天有朋友說,這個細節(jié)還是有問題,我還開玩笑說,沒 AI 的時候一些大廠程序員拿著 figma 設計稿第一版能做到這個水平,我就已經(jīng)燒高香了。
然后我就想,圖片 Agent 做了,那要不整一個視頻 Agent?
但是 AI Studio 里面沒有內(nèi)置 Veo 3.1 視頻模型,于是我就到 Youware 用 Gemini 3 試了一下,也是簡單說了一下。
提示詞:幫我做一個設計 Agent 網(wǎng)頁工具,它可以幫我自動地迭代和優(yōu)化,并且生成設計圖和設計視頻,調(diào)用所有相關的設計 AI API。
第一次他生成的視頻只有一個分鏡,于是又讓他加了多個分鏡編排的能力,讓他調(diào)用 LLM 生成提示詞和劇本。
然后搞定了,真離譜啊,選擇故事模式后他會自己生成劇本以及每個分鏡的提示詞然后調(diào)用 Veo 生成多段視頻。
然后我才反應過來,我這不是做了一個 Krea 那種 AI 聚合應用嗎,基本功能都有了,于是直接把 Krea 的界面截圖扔給他,連界面也復刻了,哈哈。
早上起來刷到一個,那種宣傳產(chǎn)品功能的用 AE 做的快閃動畫,然后就想這里面都是前端界面的元素嗎,能不能讓 Gemini 3 用代碼給我整一個。
整理了一下提示詞之后,他還真的整了一個出來,現(xiàn)在會以之前非常流行的滾動敘事網(wǎng)頁的形式表現(xiàn),如果你想做自己的產(chǎn)品網(wǎng)站的話可以參考這個提示詞,還是很吸睛的。
Gemini 3 滾動敘事網(wǎng)頁生成提示詞:
請你扮演一位擅長創(chuàng)意交互的前端開發(fā)專家。我要做一個類似 Apple 產(chǎn)品頁風格的“Scrollytelling(滾動敘事)”網(wǎng)頁 Demo。
技術棧要求:
使用 HTML、CSS 和 GSAP (GreenSock) 配合 ScrollTrigger 插件。
交互邏輯:
頁面高度要設置得很長(如 5000px),建立一個全屏固定的視口(Pinned Container)。用戶的滾動動作不移動頁面,而是作為進度條(Scrub: 1)直接控制整個動畫的時間軸播放。
視覺與動畫流程(請按順序實現(xiàn)以下 Timeline):
開場: 屏幕中心只有簡潔的文字 Slogan,隨著滾動,文字放大并漸隱消失。
UI 演示: 隨后,模擬“手機通知彈窗”和“郵件列表卡片”從不同方向平滑飛入屏幕中心。
堆疊特效: 繼續(xù)滾動,這些分散的卡片要通過 3D 變換,自動吸附堆疊在一起(Stacking Effect)。
高潮: 出現(xiàn)一個“Unsubscribe All”的按鈕,當滾動經(jīng)過它時,堆疊的所有卡片瞬間向四周炸開/飛走(Explosion Effect)。
結尾: 露出最后的 Logo。
風格要求:
極簡主義、圓角卡片設計、陰影柔和、動畫曲線要非常有彈性(Elastic/Spring)。請直接給我可運行的完整代碼文件
從三秒開始的動畫真的很頂,這個3D 卡片的旋轉懸浮然后再排列整齊的動畫非常的流暢而且豐富。
而且美學表現(xiàn)也很強,標題的漸變色、描邊以及后面卡片的細節(jié),你真的可以用這套邏輯讓 Gemini 幫你用前端寫一個宣傳視頻出來,這是一個很大的機會,可以填補目前的 AI 視頻模型做不了的部分。
上面的離譜嗎?還有更離譜的,早上看見朋友向陽喬木想用 Gemini 生成短劇點子,于是優(yōu)化了一下,看看能不能讓 Gemini 3 直接生成互動式游戲。
沒想到在 AI Studio 里面簡單調(diào)整了兩次就搞定了,Gemini 3 會根據(jù)你提供的文本生成互動式游戲,很像 GalaGame 常見的形式。
區(qū)別就是里面所有的素材都是隨著劇情的推進實時生成的,包括:對話文案、語音對話、人物頭像、畫面背景以及章節(jié)信息。
上面這是個很好的機會,人人只要有好劇本會打字就可以做互動內(nèi)容和互動游戲,再搭配蘋果前幾天給類似小程序這種產(chǎn)品松綁和降低分成,里面可能醞釀著一個新的頂級內(nèi)容消費平臺的機會。
你用下面這個提示詞在 AI Studio 里面的 Build 模式可以直接生成類似游戲,記得在第四步把文案放進去,老板以后靠這個提示詞發(fā)財了,可千萬記得點我。
Gemini 3 互動漫劇生成提示詞:
Act as a World-Class Frontend Engineer and UI/UX Designer.
Create a "High-Fidelity Interactive Visual Novel" web application using React (es6 modules), Tailwind CSS, and the Google Gemini API (@google/genai).
1. Design Philosophy & UI Style (Crucial)
The UI must strictly follow a "Japanese Commercial Galgame (Visual Novel)" aesthetic.
- Vibe: Dark Fantasy, Cyberpunk, Polish, High-End.
- Art Style for AI Generation: Enforce "Japanese Celluloid Anime Style (賽洛魯/平涂)" for all generated images.
- Dialogue Box: NOT a simple rectangle. It must feature:
- A "Glassmorphism" background (dark, blurred).
- Decorative Tech/Fantasy borders (double lines, glowing neon accents in Cyan/Gold).
- A dedicated, stylized "Nameplate" attached to the top-left of the box.
- A large, rectangular Character Avatar (3:4 ratio) on the left side with a decorative frame.
- Typography: Clean, readable serif or sans-serif with typing writer effects.
- Animations: Smooth fade-ins for backgrounds/characters, shake effects for intense scenes, flash effects for combat.
- 1.Story Engine: Iterate through a predefined script (I will provide the story content below).
- 2.AI Image Generation (Gemini Nano/Flash):
- Backgrounds: Automatically generate scene backgrounds based on the current plot location using gemini-2.5-flash-image.
- Character Tachie (Portraits): Automatically generate character standees. Apply a "Card" style frame (rounded corners, inner shadow, border) so they look like polished assets, not raw photos.
- Prompt Engineering: Automatically append "Japanese Celluloid Anime Style, masterpiece, flat color" to all image prompts to ensure consistency.
- 3.Text-to-Speech (TTS): Use the Web Speech API to read dialogue. Assign different pitch/rate to different characters (e.g., Deep/Slow for the Monster, Normal for the Protagonist).
- 4.Gemini Insight: A button to analyze the current scene's sentiment and lore using gemini-2.5-flash.
- Use a constant file to store the Story Script.
- Define Characters with properties: id, name, visualDescription (for AI generation), voicePitch, voiceRate.
- Define Backgrounds with properties: type, visualDescription.
Please parse the following novel content into the structured script.
[在此處粘貼你的小說正文內(nèi)容]
5. Technical Requirements
- Use process.env.API_KEY for Gemini.
- Handle async image generation gracefully (show a "Generating..." loader in the UI).
- Single file structure preferred or standard modular structure (App, components, services).
- Ensure the layout is responsive but optimized for Landscape viewing.
Generate the complete code now.
最后是一個很好玩的案例,可以同時表現(xiàn) Gemini 3 的多模態(tài)能力以及代碼能力,它可以直接從一張圖片幫你生成 3D 的體素圖像動畫,還原度很高。
提示詞:I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page
剛好刷到一個很好看的賽博風格圣誕樹圖片就扔個 Gemini 3 了。
沒想到它這么懂,帶縮放動畫的星星、閃光特效和旋轉的點狀發(fā)光絲帶,給整個動畫增加了非常多的表現(xiàn)力。順便用這玩意提前祝大家圣誕快樂了。
好了這期內(nèi)容就這樣了,希望這些玩法和測試能給你帶來一些啟發(fā)。
DeepMind 的人說今晚還有大的,不知道是不是昨天試的 Nano Banana Pro 模型,谷歌怕不是要熬死我們這幫人。
如果你覺得這些內(nèi)容對你有幫助的話,可以幫我點個贊或者,也可以轉發(fā)??給你需要的朋友們,我們評論區(qū)見。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.