337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌殺瘋了!Gemini 3 Flash 突襲:這個跑腿小弟差點打敗了 GPT-5.2

0
分享至

★ 設為星標 | 只講人話,帶你玩轉AIGC。

一個月前,谷歌發布了最新的 Gemini,從此我們進入了 Gemini 3 的時代。

那以后, Gemini 3 Pro 就成了我干活的主力。

但說實話,它反應是真慢,而且很多時候我只是問些簡單問題,完全沒必要深度思考。

所以,一直期待速度飛快的 Flash 系列重新回來。

終于,在今天,Gemini 3 Flash 來了!


圖:谷歌 CEO 宣布 Gemini 3 Flash 發布

谷歌這一波操作屬實把我驚到了。

官方號稱它“比快更快”,而且智商不減反增。

本來是一個“小弟”人設,但你看看它排名,居然僅次于OpenAI 最新的模型 GPT 5.2了。(就差 2 分)

真讓人情何以堪吶?


圖:第三方機構評測 Gemini 3 Flash 的綜合指標

廢話不多說,咱們趕緊來扒一扒,這個新出的 Flash 到底香不香。

01 到底是個啥?

簡單來說:把 Pro 的腦子,裝進了 Flash 的身體里。

以前我們對“Flash(輕量級)”模型的印象是什么?

跑得快,便宜,但是……有點“笨”。處理復雜任務時經常翻車。

但這次 Gemini 3 Flash 徹底打破了這個刻板印象。

遇到閑聊、簡單查詢: 它就輕裝上陣,秒回,省流又省錢;

遇到燒腦難題: 它能立馬調動深層算力,像老教授一樣深思熟慮。

它大腦似乎有個變速箱。

它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價比極限)


圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限

官方數據顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻在線。

說人話就是:多快好省!


圖:Token 消耗率對比

這種“該省省,該花花”的 AI,誰不愛?

02 憑數據說話:這波“以下犯上”有點狠

咱們不整那些虛頭巴腦的形容詞,直接看跑分數據,谷歌這次是真的下了血本。

我看了一眼實測數據,甚至有點不敢相信:它在很多任務上接近自家最強的模型 3 Pro,甚至有些指標還干掉了Pro 版。(這樣禮貌嗎?)

特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……

還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上)


圖: Gemini 3 Flash 的各項指標

先說說這個 ARC-AGI-2。

之前 GPT 5.2 發布讓大家印象深刻,其中有一個原因就是這個指標碾壓所有模型。

老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一, 主要測試模型到底有沒有腦子。

它是由 Keras 之父 Fran?ois Chollet 搞出來的,專門用來反死記硬背的。

比如這種題目:


圖:ARC-AGI 2 題目

以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。

這項指標 Flash 竟然超過了自己的 Pro 大哥,僅次于 GPT-5.2!

這個小弟,要造反了有點腦子!

在另一項指標: GPQA Diamond(研究生級別的專家推理測試)里,它拿了 90.4 分。

意思就是智商堪比博士。

看這個數字,它的推理能力已經和那些大塊頭的前沿模型(Pro 版)平起平坐了。

在著名的“Humanity's Last Exam(人類最后一場考試)”這種地獄級難度的測試里,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。


圖:HLE 分數對比

它跟 GPT-5.2(45.5%)這種超級旗艦模型,只差了不到 2 分!

朋友們,別忘了,這可是一個 Flash 模型啊!

它的定位本來是“跑腿小弟”,結果一不小心把“業界大佬”們的飯碗給砸了。(面子?不存在的。)

這哪里是“輕量版”,這分明是“披著閃電俠外衣的超人”。

在多模態測試(MMMU Pro)中得分 81.2%,看圖、看視頻的能力基本和 Gemini 3 Pro 五五開。

也就是,眼神兒更好使。


圖:MMMU-Pro 指標對比

最讓我意外的是這個——在 SWE-bench Verified(代碼智能體測試)中,它得分 78%。

直接超越了 Gemini 2.5 全系,甚至在某些這就需要改代碼的任務上,比 Gemini 3 Pro 還要好用!

本來以為它動動嘴還行,沒想到寫代碼更溜!

一句話總結:它不是“丐版”,它是“精簡版戰神”。

03 為什么我建議你立馬換用 Flash?

作為這一年多幾乎天天都在用 AI 的人,我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的:

1. 真的太快了!??

根據第三方測評(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。

以前問 AI 一個問題,你可能還得切出去回個消息等它寫完。

現在?你字剛打完,它答案就懟到你臉上了。

這種“跟手”的感覺,對于我們需要快速寫文案、改代碼的人來說,簡直是救命。

2. 價格那是相當感人


圖:Gemini 3 Flash 價格

輸入 100 萬 Token 只要 0.5 美刀,輸出只要 3 美刀。

想想看,它現在比 2.5 Pro 強太多了,但價格卻只有它的 30-40%。

這基本就是白菜價了,對于開發者來說,成本焦慮直接減半。

3. 智商不掉線

既有速度,又有 Pro 級的推理能力。

處理復雜的長文檔分析、視頻理解,它完全都在行。

04 怎么用?能干啥?

好消息是,這玩意兒現在就是 Gemini 的“默認配置”。

不管你是普通用戶還是開發者,現在就能上手玩。

普通玩家:直接打開 Gemini App 或者 Google 搜索,它已經在那里等你了(是的,免費用)。

我們打開 Gemini,會看到 Fast 和 Thinking 兩個新增的模型。

它們就是 Gemini 3 Flash!


圖:Gemini 3 Flash

開發者大佬:去 Google AI Studio 或者 Vertex AI 就能調 api。

因為它延遲極低,拿來做那種需要即時反饋的語音助手、視頻分析工具簡直完美。

05 寫在最后

至此,Gemini 3 家族算是真正“齊活”了。

  • Pro 是全能六邊形戰士;

  • Deep Think 是深思熟慮的掃地僧;

  • Flash 則是身手敏捷的急先鋒。

回顧這一年,不得不說谷歌是真聽勸,也是真拼。

以前總有人吐槽大廠喜歡“擠牙膏”,但這幾次發布,從 Pro 到 Deep Think 再到今天的 Flash(還有 Nano Banana Pro),每一次都是誠意滿滿的“硬菜”。

特別是今天的 Flash,說實話,雖然在谷歌家里它定位是“小弟”,但這性能、這智商,放在其他任何一家公司,高低得掛個“旗艦(Ultra/Pro)”的名號。

當然,神仙打架,受益的是咱們。你們打吧,我喜歡。

大家趕緊去試試,回來告訴我:這個“免費版戰神”,有沒有刷新你對 AI 速度的認知?

評論區聊聊:你覺得 GPT-6 還有多久到達戰場?

如果覺得這篇文章對你有所幫助,別忘記點贊、??并轉發給你的朋友。

我們下期再見~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
被捕后搜出藥片!50歲老虎伍茲首次回應:暫別一段時間 接受治療

被捕后搜出藥片!50歲老虎伍茲首次回應:暫別一段時間 接受治療

念洲
2026-04-01 09:42:14
賽力斯官宣完成第五代2.0T超級增程技術開發

賽力斯官宣完成第五代2.0T超級增程技術開發

IT之家
2026-04-01 22:24:09
難以置信!成都一高中教師年收入曝光,含公積金近22萬,評論炸鍋

難以置信!成都一高中教師年收入曝光,含公積金近22萬,評論炸鍋

火山詩話
2026-03-31 17:08:57
李湘母女現身韶山獻花,瘦了得有20斤大變樣,兩人關系變冷沒互動

李湘母女現身韶山獻花,瘦了得有20斤大變樣,兩人關系變冷沒互動

林雁飛
2026-03-31 18:33:32
女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

青蘋果sht
2026-02-22 06:58:10
活久見,公司把員工開除后又起訴了,理由是刻意隱瞞自身價值!

活久見,公司把員工開除后又起訴了,理由是刻意隱瞞自身價值!

黯泉
2026-03-31 17:21:23
終于有了結果,曾醫生能保住醫院的工作,最應該感謝的三位貴人!

終于有了結果,曾醫生能保住醫院的工作,最應該感謝的三位貴人!

凌風的世界觀
2025-11-14 08:38:31
改寫歷史,真主黨打進了以色列本土

改寫歷史,真主黨打進了以色列本土

星火聊天下
2026-03-30 16:09:46
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
淚目名場面!卡塞米羅妻子被球迷挽留哭紅眼,溫情告別曼聯

淚目名場面!卡塞米羅妻子被球迷挽留哭紅眼,溫情告別曼聯

夜白侃球
2026-04-01 14:07:24
17.99萬!大眾官宣:新車正式上市

17.99萬!大眾官宣:新車正式上市

高科技愛好者
2026-04-01 23:02:18
魯山舅舅娶亡姐大結局!新華社通報調查結果,這次終于真相大白了

魯山舅舅娶亡姐大結局!新華社通報調查結果,這次終于真相大白了

離離言幾許
2026-03-30 22:39:30
伊朗愿結束戰爭 道指大漲1125點 白銀飆升7.24%

伊朗愿結束戰爭 道指大漲1125點 白銀飆升7.24%

每日經濟新聞
2026-04-01 07:08:17
上海女排奪冠背后:一座城,三個男人,二十五年再圓夢!

上海女排奪冠背后:一座城,三個男人,二十五年再圓夢!

上觀新聞
2026-04-02 04:24:33
國產霹靂-2導彈:造價超紅旗轎車,生產2950枚未命中

國產霹靂-2導彈:造價超紅旗轎車,生產2950枚未命中

余們搞笑段子
2026-04-02 00:37:16
金庸把最難聽的名字給了他,小時候覺得霸氣,長大后讀出來都臉紅

金庸把最難聽的名字給了他,小時候覺得霸氣,長大后讀出來都臉紅

耳東文史
2026-03-28 00:03:04
伊朗國防軍為何在本次伊朗戰爭中未參戰?

伊朗國防軍為何在本次伊朗戰爭中未參戰?

深度報
2026-03-30 22:04:19
從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

阿胡
2026-03-30 12:52:29
女排聯賽頒獎:MVP出人意料,17歲小將風光無限,有人未領到獎

女排聯賽頒獎:MVP出人意料,17歲小將風光無限,有人未領到獎

真理是我親戚
2026-04-01 22:15:14
重慶浙江爭奪“張雪”,爭的是什么

重慶浙江爭奪“張雪”,爭的是什么

城市進化論
2026-04-01 21:25:12
2026-04-02 07:28:49
AI范兒 incentive-icons
AI范兒
AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
702文章數 656關注度
往期回顧 全部

科技要聞

甲骨文血洗3萬人,47人團隊僅留3人

頭條要聞

伊朗自殺無人機突進北印度洋 逼退“林肯”號航母

頭條要聞

伊朗自殺無人機突進北印度洋 逼退“林肯”號航母

體育要聞

NBA擴軍,和籃球無關?

娛樂要聞

張婉婷已決定離婚 找律師討論婚變事宜

財經要聞

電商售械三水光針 機構倒貨or假貨猖獗?

汽車要聞

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態度原創

手機
家居
數碼
本地
公開課

手機要聞

反向操作:有人給iPhone 17 Pro加回Lightning接口

家居要聞

經典配色 晝色銀河

數碼要聞

小米路由器BE7000獲1.1.38版本升級,新增專屬網絡等功能

本地新聞

從學徒到世界冠軍,為什么說張雪的底氣在重慶?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版