337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌數到3,這次輪到Gemini遙遙領先|Landing AI

0
分享至



現在輪到谷歌數到3了。

今天凌晨,谷歌正式公布了Gemini 3系列模型,并率先上線Gemini 3 Pro預覽版。按照介紹,開發者現可以在Google AI Studio直接調用API,Gemini應用已同步切換到新模型,企業與開發平臺側的更新則也已經納入近期計劃。

對外而言,這次發布看似沿襲了大模型迭代的慣常節奏,但從谷歌的表述方式到模型本身呈現出來的能力,都暗示著一個趨勢:Gemini 3不再只是參數與跑分的躍遷,而是在嘗試重新定義“模型在系統中的位置”。

Gemini 3 Pro被谷歌歸納為三個核心變化:推理強度提升、事實一致性增強、多模態能力從設計之初就內置而非附加。這意味著模型在對話中處理文本、圖像、音頻、視頻不再需要分階段切換,而是以統一的方式理解信息結構。

官方給出的示例依舊貼近日常場景:把家里幾種語言混寫的手寫菜譜拍照丟給它,它能整理成一本統一格式的家庭菜譜;把一串長視頻講座交給它,它會把關鍵知識點拆成交互式卡片,甚至生成簡單的可視化工具來輔助記憶。在Gemini應用中,Canvas工作區能夠支持更完整的“小項目”;在Gemini Labs里,它也能根據你的問題生成類似雜志排版的界面。

這些特性看上去像是一次體驗層面的升級,但真正讓Gemini 3 Pro與以往不同的,是它在各類評估中的表現出現了領先式的變化,而不僅是“略微更準一點”。

過去一年,模型在各類基準測試中的差距往往停留在小范圍波動。現在,一些關鍵指標第一次被明顯拉開。


最突出的表現落在高難度數學與復雜推理方向。Gemini 3 Pro在MathArena Apex中拿到23.4%的正確率,而上一代模型為0.5%、Claude為1.6%、GPT-5.1為1.0%——這是長期停滯區間第一次被大幅突破。

在跨領域推理考試中,這種差距繼續擴大。例如在Humanity’s Last Exam中,Gemini 3 Pro的無工具得分達到37.5%,工具模式則提升至45.8%,高于上一代的21.6%和GPT-5.1的26.5%。在GPQA Diamond中,它也以91.9%領先于同類模型的83%—88%區間。

多模態方面的變化則更集中體現在“界面理解”能力上。谷歌首次在技術資料中單列屏幕截圖理解,模型不僅能識別內容,還能把握界面結構、按鈕層級與可操作區域。

在ScreenSpot-Pro中,Gemini 3 Pro達到72.7%,而GPT-5.1僅為3.5%,Claude為36.2%,上一代Gemini為11.4%。這里的差距不只是識別率問題,而是決定了Agent是在“憑感覺點擊”,還是確實理解界面語境。

這種能力直接關系到Agent在操作電腦時是否能保持“情境意識”——能否基于界面判斷接下來會發生什么。對于任何期待AI“完成任務”的系統而言,這類能力遠比單純的圖像識別更關鍵。

更廣泛的表現也與谷歌想強調的方向一致:Gemini 3 Pro在多學科理解、視頻推理和事實一致性上都拉開差距,并在工程類任務中顯現出更高的穩定度。

例如在SimpleQA Verified中,Gemini 3 Pro達到72.1%,而同類模型普遍落在30%—35%區間;多語言綜合能力的MMLU中,它拿下91.8%,略高于GPT-5.1的91.0%,并領先Claude的89.1%。

在工程類任務上,它不僅能處理更復雜的代碼生成,還能在涉及實際環境的測試中穩定執行。例如在Terminal-Bench 2.0中,Gemini 3 Pro達到54.2%,而Claude為42.8%,GPT-5.1為47.6%;在長鏈路任務Vending-Bench 2中,它的收益為5478美元,而其他模型普遍在1500—3800美元之間。

不過,Gemini 3真正有意義的部分,不在于單項能力的提升,而是谷歌圍繞它構建的系統形態。伴隨此次更新推出的Antigravity,是一個以Agent為核心的開發環境。它并不是“補齊代碼空缺”的工具,而是讓模型能夠直接參與開發流程:理解需求、拆分任務、生成代碼、運行測試、檢查界面效果,再回到代碼層面調整。

于此,谷歌通過把不同模型組合使用,讓Agent在編輯器、終端與瀏覽器之間自由切換,從而承接一段完整的執行鏈。對于結構不算復雜的項目,它已經能承擔起實際工作。

面向普通用戶的變化,則更集中體現在Gemini應用和Google搜索上。Gemini 3 Pro從第一天起就是默認模型,而應用內的“Gemini Agent”可以處理多步決策任務,例如歸檔郵件、安排行程或處理需要反復查找信息的事務。搜索端的AI Mode也開始呈現更動態的信息布局,包括結構化數據、圖片、時間軸甚至交互組件。這些變化來自于Gemini 3對查詢的拆分與重組,再由生成式界面組合展示,背后依賴的是更強的意圖理解能力。

此外,谷歌在這一代模型中主動強調了一個方向:Gemini 3 Pro在回答時更少迎合用戶,而更傾向于提供有信息密度的反饋。“降低迎合性”既對應今年的對話安全討論,也說明谷歌正在嘗試把“內容質量”變成產品特性,而不是語言風格。

基于上述這些,不難發現,Gemini 3的意義并不僅僅在于“跑分領先多少”,而更多的是,它把能力重新組織成一個能堅持執行任務、能跨模態整合、能在真實環境中保持結構穩定的系統。對谷歌來說,這提出了一個與GPT系列不同的回答:AI不僅要強,更要穩;不僅要會生成,更要懂場景;不僅能理解界面,更要能在界面中持續行動。

當然,接下來,Gemini 3能夠走多遠,所依仗的遠非這些看起來很漂亮的跑分和能力,而是在日常使用中,能有多少真正留得住的地方。

Landing AI

Landing AI是由動點科技策劃的一檔聚焦人工智能領域的專題報道欄目。通過對AI落地前景以及幕后故事的發掘,我們將在這一專題中深入淺出地探討關于AI新浪潮下的一切可能。

本文為動點科技記者原創文章,未經授權不得轉載,如需轉載或開白請在后臺回復“轉載”。

- - - - - - - - END - - - - - - - -

*想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發放!

精彩好文值得推薦

一鍵轉發,戳個在看


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
連大學都沒上過的“學渣”,卻當了央視30年名嘴,如今成女性榜樣

連大學都沒上過的“學渣”,卻當了央視30年名嘴,如今成女性榜樣

珺瑤婉史
2026-03-30 00:30:03
于東來婉拒市長飯局!

于東來婉拒市長飯局!

李萬卿
2026-03-30 14:42:16
照顧帶病長壽的婆婆12年,我發現一個扎心真相:誰有良心誰就遭罪

照顧帶病長壽的婆婆12年,我發現一個扎心真相:誰有良心誰就遭罪

小馬達情感故事
2026-03-29 18:10:03
意大利媳婦被中國企業裁員,心灰意冷帶著山東丈夫回到意大利

意大利媳婦被中國企業裁員,心灰意冷帶著山東丈夫回到意大利

北緯的咖啡豆
2026-03-30 19:32:43
70歲后才懂得:親手帶大的孫輩,不管孫子還是外孫,都有5個現實

70歲后才懂得:親手帶大的孫輩,不管孫子還是外孫,都有5個現實

藝鑒在線
2026-03-20 18:31:57
墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

七阿姨愛八卦
2026-03-29 10:12:33
闊別7年多終于“回歸”!南京3條公交線路恢復升州路行駛

闊別7年多終于“回歸”!南京3條公交線路恢復升州路行駛

現代快報
2026-03-30 23:16:03
真的來了!5099 的 iPhone Air 正式上架

真的來了!5099 的 iPhone Air 正式上架

XCiOS俱樂部
2026-03-30 08:58:50
豐田終于被當作真電車!鉑智7預售破萬,用戶對比最多的是Model 3

豐田終于被當作真電車!鉑智7預售破萬,用戶對比最多的是Model 3

言車有徐
2026-03-29 21:20:33
美伊進入倒計時,美方暗布南海彈藥廠,下一場大戰就在中國門口?

美伊進入倒計時,美方暗布南海彈藥廠,下一場大戰就在中國門口?

可樂愛微笑
2026-03-31 05:32:50
何超瓊不愧是豐腴美人,穿白色低胸連衣裙凹凸有致,老了更撩人!

何超瓊不愧是豐腴美人,穿白色低胸連衣裙凹凸有致,老了更撩人!

蓓小西
2026-03-17 08:39:55
從上海到成都6小時直達!5000億超級工程,把長江經濟帶焊成一體

從上海到成都6小時直達!5000億超級工程,把長江經濟帶焊成一體

小鹿姐姐情感說
2026-03-31 03:09:41
當你知道某些真相后,有些東西再也無法直視了!網友:真得少吃

當你知道某些真相后,有些東西再也無法直視了!網友:真得少吃

夜深愛雜談
2026-03-28 18:18:32
雄鹿隊波蒂斯力挺活塞隊坎寧安,反對65場規則:我認為這不公平

雄鹿隊波蒂斯力挺活塞隊坎寧安,反對65場規則:我認為這不公平

好火子
2026-03-31 04:45:57
乞丐為何很少生病?道正一語道破:他們少了三樣俗物,百邪不近身

乞丐為何很少生病?道正一語道破:他們少了三樣俗物,百邪不近身

千秋文化
2026-02-13 18:55:13
加密貨幣,被狠狠拋售!

加密貨幣,被狠狠拋售!

澳洲財經見聞
2026-03-31 03:52:44
癱瘓28年桑蘭近況:45歲仍白皙漂亮,嫁資產千萬老公,兒子已12歲

癱瘓28年桑蘭近況:45歲仍白皙漂亮,嫁資產千萬老公,兒子已12歲

拳擊時空
2026-03-30 06:17:40
她帶弟弟進入娛樂圈,沒想到如今自己無人問津,弟弟卻紅透半邊天

她帶弟弟進入娛樂圈,沒想到如今自己無人問津,弟弟卻紅透半邊天

看盡落塵花q
2026-03-05 19:53:18
伊朗總統:結束戰爭將以維護國家尊嚴、利益和安全為前提

伊朗總統:結束戰爭將以維護國家尊嚴、利益和安全為前提

財聯社
2026-03-30 23:54:10
打擊伊朗為何不需要太多美軍呢?因為只需打垮12.5萬革命衛隊而已

打擊伊朗為何不需要太多美軍呢?因為只需打垮12.5萬革命衛隊而已

民間胡扯老哥
2026-03-30 05:05:52
2026-03-31 06:19:00
動點科技 incentive-icons
動點科技
關注值得關注的科技創新
25545文章數 148798關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

白宮:特朗普希望4月6日前與伊朗達成協議

頭條要聞

白宮:特朗普希望4月6日前與伊朗達成協議

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

全紅嬋聊到體重哭了,每天只吃一頓飯

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

限時12.58萬起 銀河星耀8遠航家系列上市

態度原創

教育
數碼
旅游
公開課
軍事航空

教育要聞

為什么從英國留學回來后還想重新回去?

數碼要聞

OPPO Pad 5 Pro平板現身官網,消息稱將搭載第五代驍龍8至尊版

旅游要聞

清明節假期,西藏拉薩布達拉宮景區:所有游客門票半價

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版