337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<sup id="u6uuu"><delect id="u6uuu"></delect></sup>

<tr id="u6uuu"><small id="u6uuu"></small></tr>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.2深夜炸場，評測碾壓谷歌Gemini 3 Pro，真正的打工人利器

2025-12-12 11:48:16　來源: AI先鋒官

北京舉報

0

分享至

　　作者｜沐風

　　來源｜AI先鋒官

　　上周，OpenAI CEO奧特曼剛宣布完公司進入“紅色警戒”（Code Red）狀態，要求團隊將工作重心轉移到提高ChatGPT的性能和用戶體驗上后。

　　就在今天，OpenAI發布了最新的頂級模型 GPT-5.2系列。

　　GPT-5.2 將向 ChatGPT 付費用戶開放，并通過 API 提供給開發者，一共分為三個系列：

　　GPT?5.2 Instant（即時版）

　　GPT?5.2 Thinking（思考版）

　　GPT?5.2 Pro（專業版）

　　在OpenAI官方公布的基準測試中，它幾乎對Gemini 3 Pro、Claude Opus 4.5實現了全方位碾壓。

　　

　　值得注意的是，GPT?5.2 Thinking在AIME 2025（數學）的分數達到了滿分，Gemini 3 Pro 的分數是 95%。

　　OpenAI應用CEO Fidji Simo曾說過，GPT-5.2 的設計目標就是為人們創造更多經濟價值。

　　那么如何創造呢？

　　那就不得不提到GPT-5.2的拿手好戲：制作電子表格、構建演示文稿、編寫代碼、理解圖像、處理超長上下文、使用工具，以及執行復雜的多步驟項目等等。

　　空口無憑，讓我們先來看看數據。

　　在OpenAI新出的基準測試GDPval（覆蓋 44 個職業、針對明確知識工作任務的評估體系）中，GPT-5.2 Thinking 在70.9%的任務上勝過或打平行業專家，GPT-5.2 Pro更高，為74.1%。

　　

　　主要測試內容為制作演示文稿、電子表格以及其他專業產出物。

　　官方還放出了對比圖，GPT-5.2 做的表格比GPT-5.1確實精細很多。

　　

　　一個評審員對此的評價是：“看起來像是一個有員工的專業公司做的，布局和建議都很專業，雖然還有一些小錯誤需要修正。”

　　另外，GPT-5.2 Thinking生成輸出的速度也超過人類專家11 倍以上，成本不到人類專家的1%。

　　OpenAI 聲稱這是AI模型首次達到了“人類專家水平”。

　　在ARC-AGI放出的測試中，此前o3 (High) 在ARC-AGI-1測試得分為88%，平均每項任務成本為4500美元。

　　而GPT-5.2 Pro (X-High) 最新SOTA得分為90.5%，是第一個突破90%的模型，它的平均任務成本僅為11.64美元，在一年內效率提高了約390倍。

　　

　　ARC-AGI-2（抽象推理）的分數是 52.9%，相較此前翻了三倍，對比Gemini 3 Pro是 31.1 %。

　　

　　GPT-5.2 Thinking的代碼能力也同樣刷新了紀錄：

　　在SWE-bench Verified上，得分達到80%。

　　在SWE-Bench Pro上，得分達到55.6%。

　　

　　SWE-Bench Pro是新的代碼基準測試，比SWE-bench Verified更難，涵蓋四種編程語言，不只是Python，更接近真實軟件工程。

　　早期測試者特別提到，GPT-5.2在前端的能力也明顯提升了，尤其是3D和復雜UI。

　　官方也放出了由單prompt生成的demo：

　　

　　同時，GPT-5.2 Thinking在長文檔處理方面的表現也很亮眼。

　　在OpenAI自制的MRCRv2（長文檔中多個信息點的整合能力）評測中，GPT-5.2 Thinking成為首個在256k 上下文長的4-needle上達到接近100%準確率的模型。

　　

　　不過，更難的8 needle版還是有明顯下降。

　　

　　GPT-5.2 Thinking的視覺能力也明顯提升，錯誤率基本減半。

　　在CharXiv Reasoning測試中，GPT-5.2 Thinking得分達到88.7%，GPT-5.1是80.3%。

　　

　　在ScreenSpot-Pro測試中，GPT-5.2 Thinking得分達到86.3%。GPT-5.1 是 64.2%。

　　

　　在官方放出的示例中，OpenAI 要求模型識別輸入圖像中的組件，并返回帶有大致邊界框的標簽。

　　

　　即使在低質量圖像上，GPT-5.2 也能識別出主要區域，并放置有時能與每個組件真實位置相匹配的框；而 GPT-5.1 僅標記了少數幾個部分，且對其空間排列的理解要弱得多。

　　而且，GPT-5.2 Thinking 的幻覺比GPT-5.1 Thinking更少了。

　　在一組去標識化的ChatGPT查詢中，前者包含錯誤的回答相對減少了30%。

　　

　　最后，我們來聊聊價格，GPT-5.2的價格一如既往的貴到離譜。

　　GPT-5.2的定價為1.75美元/百萬輸入Token，14美元/百萬輸出Token，緩存輸入有90%的折扣，比GPT-5.1貴40%。

　　ChatGPT訂閱價格不變。

　　

　　但是！

　　在多個智能體評估中，盡管GPT-5.2的每Token成本更高，但GPT-5.2由于更高的Token效率，性價比反而更高。

　　ChatGPT 將于今日開始逐步推出 GPT-5.2（包括 Instant、Thinking 和 Pro 版本），首先面向付費用戶（Plus、Pro、Go、Business 和 Enterprise 版本）提供。

　　為確保 ChatGPT 的流暢性和穩定性，GPT-5.2 將分階段部署，在 ChatGPT 中，付費用戶仍可在三個月內繼續使用 GPT-5.1（舊版模式），之后 GPT-5.1 將逐步下線。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌干掉「請再說一次」！Gemini 3.1毫秒級接話，實時Agent時代來了

新智元 2026-03-28 11:43:16
6 跟貼 6
谷歌一夜塌房！干崩內存股論文被曝抄襲，華人學者血淚控訴

新智元 2026-03-28 15:36:22
16 跟貼 16

一篇論文砸崩存儲芯片巨頭股價，谷歌干了什么？

量子位 2026-03-28 02:40:37
0 跟貼 0

早報｜蘋果高管：未來50年iPhone仍是AI時代的核心/xAI聯合創始人全數離職/智駕車專屬保險率先落地北京，覆蓋L2~L4

愛范兒 2026-03-30 08:38:18
0 跟貼 0
2027年谷歌利潤將歸零，最新預測引熱議

量子位 2026-03-30 09:06:47
0 跟貼 0

8個月前AI就知道他要殺人！ChatGPT員工爭論了很久，選擇沉默… 最后8個生命消失在這座小鎮

英國那些事兒 2026-02-22 22:49:40
1752 跟貼 1752

機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
4 跟貼 4
韓女團成員撞臉艾達王后谷歌搜索量暴增！你覺得像嗎

游民星空 2026-03-29 15:35:28
179 跟貼 179

谷歌發布新型AI內存壓縮技術！全球存儲芯片股集體下挫

時代周報 2026-03-28 08:47:30
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
美自媒體公司成癮設計被判賠300萬美元

artvip 2026-03-27 17:58:17
0 跟貼 0
教育產業日報(03.28) : 谷歌學術造假風波

億歐 2026-03-29 11:53:51
0 跟貼 0
從“養蝦”狂歡到落地“最后一公里”：騰訊智能體走向深水區

每日經濟新聞 2026-03-28 16:13:14
0 跟貼 0
世貿天階拆了？實為煥新升級，籃球中心謝幕，4K天幕將登場

新京報 2026-03-29 17:11:22
643 跟貼 643
龍蝦為啥越養越貴，越用越蠢？

鈦媒體APP 2026-03-28 19:53:33
11 跟貼 11
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
74 跟貼 74
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0
全國累計器官捐獻志愿登記人數超過733萬

環球網資訊 2026-03-29 12:57:07
15753 跟貼 15753
OpenClaw 3.28上線！4天爆更上百項重要更新

新智元 2026-03-29 15:32:28
55 跟貼 55
1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0
讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
140萬億Token之后：中國AI亟待從規模領先到價值躍遷

鈦媒體APP 2026-03-29 09:58:10
13 跟貼 13
服務行業考慮用戶感受，不喜歡可以不做，這樣式的員工我打過3個

酷酷的小生活 2026-03-29 08:44:47
0 跟貼 0
趨境ATaaS平臺發布，打造日均萬億產能的“Token工廠”

量子位 2026-03-28 21:56:10
0 跟貼 0
官方定了 “詞元”，Token爭議還沒停

齊魯壹點 2026-03-29 22:15:17
110 跟貼 110
Gemini 3一句話打造拍立得應用刷屏！全網最火8個玩法都在這，看完秒上手

愛范兒 2025-11-20 18:04:33
0 跟貼 0
索尼把PS6成本藏了760刀，賣699還嫌貴？

硅嶼手記 2026-03-30 08:44:37
1 跟貼 1
宇樹科技王興興：具身智能 GPT時刻大概還需兩到三年

每日經濟新聞 2026-03-29 16:05:45
46 跟貼 46
真實體驗，15年油車用戶換電車，哪好哪差？

閆闖說車 2026-03-26 15:12:29
0 跟貼 0
成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0
論芯率先跑進AI for EDA產線：讀芯片協議文檔速度25倍

量子位 2026-03-29 09:25:33
0 跟貼 0
日供29元，卷成這樣了？

中國新聞周刊 2026-03-29 19:17:09
450 跟貼 450
霍爾木茲海峽大消息！俄羅斯：禁止汽油出口！經濟學家：全球糧價面臨上漲風險

中國能源網 2026-03-29 10:59:04
100 跟貼 100
打破代碼大模型訓練瓶頸：MicroCoder將算法數據框架訓練經驗升級

量子位 2026-03-29 23:51:02
0 跟貼 0
Meta和谷歌致人成癮被判賠償600萬美元

界面新聞 2026-03-28 02:32:43
0 跟貼 0
孫少軍：問界M6訂單超預期，非華為用戶占比超過50%！

風蛍月緩緩 2026-03-29 05:08:39
1 跟貼 1
2026版型出眾的男裝褲子全評測，選款不踩雷

有范熱文 2026-03-28 23:41:57
1 跟貼 1
吸血鬼Fourth追愛3年，Gemini一句"永遠"讓他破防

賽博蘭博 2026-03-28 08:50:00
0 跟貼 0
蔡磊透露身體近況：四個人同時攙扶也無法邁步挪動了

極目新聞 2026-03-29 22:40:10
463 跟貼 463
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1747 跟貼 1747

知名女模特曝華子再陷私生子漩渦！曾轉賬10萬美元要求打掉被拒絕

知名女模特曝華子再陷私生子漩渦！曾轉賬10萬美元要求打掉被拒絕

Emily說個球

2026-03-29 21:30:20

1983年鐵道兵集體轉業，兩位開國上將司令員和政委，一個成了鐵道部部長，另一個去了哪里

1983年鐵道兵集體轉業，兩位開國上將司令員和政委，一個成了鐵道部部長，另一個去了哪里

文史明鑒

2026-03-22 23:29:09

高市鐵心賣國！日本決定出兵中東，中方不再忍，對日再出重拳反制

高市鐵心賣國！日本決定出兵中東，中方不再忍，對日再出重拳反制

消費俠

2026-03-28 09:03:58

杜月笙在河邊釣魚，遇到地痞要保護費，杜月笙：找你們老板過來

杜月笙在河邊釣魚，遇到地痞要保護費，杜月笙：找你們老板過來

千秋文化

2026-03-25 21:29:50

特朗普幫了中國大忙，中國首次成為全球第一，日本完全被踩在腳下

特朗普幫了中國大忙，中國首次成為全球第一，日本完全被踩在腳下

小小科普員

2026-03-26 00:27:10

三節10助攻！火箭隊杜蘭特轉型？得分王變組織前鋒，盤活全隊進攻

三節10助攻！火箭隊杜蘭特轉型？得分王變組織前鋒，盤活全隊進攻

熊哥愛籃球

2026-03-29 20:35:26

張雪峰生前最后一瓶水有問題！？

張雪峰生前最后一瓶水有問題！？

八卦瘋叔

2026-03-27 11:25:06

特斯拉車主：Model 3 + HW4.0 買完 FSD 秒推送！

特斯拉車主：Model 3 + HW4.0 買完 FSD 秒推送！

新浪財經

2026-03-29 13:56:50

農村家長曬5個兒子，被網友群嘲：送外賣都費勁，還為國效力呢？

農村家長曬5個兒子，被網友群嘲：送外賣都費勁，還為國效力呢？

今朝牛馬

2026-03-27 18:23:13

斯諾克賽程：今晚2場冠軍PK，小特2劣勢或被爆冷，吳宜澤凌晨首秀

斯諾克賽程：今晚2場冠軍PK，小特2劣勢或被爆冷，吳宜澤凌晨首秀

劉姚堯的文字城堡

2026-03-30 08:27:05

痞幼因網紅身份，在別墅區被鄰居集體“抵制”

痞幼因網紅身份，在別墅區被鄰居集體“抵制”

笑飲孤鴻非

2026-03-29 06:41:39

一女子打賞男主播后覺得下頭要退錢，聊天記錄曝光：尺度真大

一女子打賞男主播后覺得下頭要退錢，聊天記錄曝光：尺度真大

談史論天地

2026-03-30 08:59:23

女子家門未關嚴，流浪狗尾隨入室咬傷其腿，3天后狗死了，狂犬病毒檢測呈陽性；多方回應事件進展

女子家門未關嚴，流浪狗尾隨入室咬傷其腿，3天后狗死了，狂犬病毒檢測呈陽性；多方回應事件進展

大風新聞

2026-03-29 13:28:09

德隆曬全家福，二婚娶性感嬌妻，3個孩子高顏值，轉型成功不缺錢

德隆曬全家福，二婚娶性感嬌妻，3個孩子高顏值，轉型成功不缺錢

大西體育

2026-03-29 21:29:44

3：1！朱婷決賽對手確定，艾格努35分，完勝安娃，主力接應難撼動

3：1！朱婷決賽對手確定，艾格努35分，完勝安娃，主力接應難撼動

跑者排球視角

2026-03-30 07:09:13

百度抓蝦吧禁止人類發帖引爭議，客服回應：后續將跟進處理

百度抓蝦吧禁止人類發帖引爭議，客服回應：后續將跟進處理

DoNews

2026-03-30 08:46:05

今年說什么也要換電車了，因為國家發話了，從4月1日開始

今年說什么也要換電車了，因為國家發話了，從4月1日開始

周哥一影視

2026-03-29 23:34:49

郭麒麟白嫖網紅外賣媛！

八卦瘋叔

2026-03-28 09:58:03

猝死的人越來越多？醫生再次強調：寧可打打牌，也別做這6事

猝死的人越來越多？醫生再次強調：寧可打打牌，也別做這6事

岐黃傳人孫大夫

2026-03-28 22:55:03

隊史首次進季后賽！楊瀚森場均17分9板3助1帽！開拓者主帥攤牌了

隊史首次進季后賽！楊瀚森場均17分9板3助1帽！開拓者主帥攤牌了

世界體育圈

2026-03-29 12:54:56

AIGC大模型及應用精選與評測

467文章數 69關注度

往期回顧全部

科技要聞

DeepSeek“崩了”一夜，仍無法正常使用

頭條要聞

牛彈琴：開戰30天后一場更猛烈的風暴即將到來

頭條要聞

牛彈琴：開戰30天后一場更猛烈的風暴即將到來

體育要聞

絕殺衛冕冠軍后，他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現！李榮浩喊話單依純侵權

財經要聞

油價沖擊，有些亞洲貨幣先扛不住了！

汽車要聞

嵐圖泰山X8配置曝光四激光雷達/華為新一代座艙

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

旅游

教育

房產

藝術

手機要聞

彭博社記者稱蘋果折疊屏iPhone將是重大改款機型！

旅游要聞

香江四季繁花盛，灣區共促“賞花經濟”正當時

教育要聞

被焦慮壓垮的童年：中小學心理問題的系統性反思

房產要聞

首日430組來訪，單日120組認籌！海口首個真四代，徹底爆了！

藝術要聞

毛主席的草案遭吐槽！退休前能否再創輝煌？

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tr id="uuuuu"></tr>

<tfoot id="uuuuu"><noscript id="uuuuu"></noscript></tfoot>

<nav id="uuuuu"><sup id="uuuuu"></sup></nav>

<sup id="uuuuu"></sup>