大家好,我是冷逸。
今天除夕夜,咱們繼續(xù)肝呀。
誰叫阿里又整了大活呢,剛剛他們開源了全新一代模型千問3.5(Qwen3.5-Plus),性能媲美Gemini 3 Pro、GPT-5.2等頂級閉源模型,登頂全球最強開源大模型。
![]()
這次,千問3.5帶來了全新的架構(gòu),用上了他們自研的門控技術(shù)(在去年斬獲了NeurIPS最佳論文)。所以僅用397B參數(shù)(激活參數(shù)17B)就超過了萬億參數(shù)的Qwen3-Max,而且解碼吞吐量暴增19倍。
![]()
當然,作為打工人,最關(guān)心的還是價格。千問3.5,上下文提升至1M,每百萬Token輸入只有0.8元,不到GPT 5.2的1/15、Gemini 3 Pro的1/18。
而且,它也是目前國內(nèi)少有的,支持視覺理解的原生多模態(tài)模型。
因為它是在視覺和文本Token的混合數(shù)據(jù)上進行預(yù)訓(xùn)練的,讓張開“眼睛”的千問3.5學(xué)會了更密集的世界知識和推理邏輯。
目前,在千問APP中已經(jīng)可以免費體驗。阿里云百煉,也上線了千問3.5的API服務(wù)。
![]()
一手實測
模型上線后,第一時間給大家?guī)砹藢崪y效果。
1)推理:AI智力題
先來第一道,最近火出圈的「洗車難題」。
我想去洗車,洗車店距離我家50米,你說我應(yīng)該開車過去還是走過去?
千問3.5答對了,而且還知道我在調(diào)侃它,“除非你打算把車拆了扛過去,或者叫拖車(那也太夸張了),否則只能把車開過去才能洗哦!”
![]()
有點意思,這個邏輯推理能力我似乎只在Gemini 3 Pro上見過。沒想到,也有國產(chǎn)模型這么聰明了。
再來一個問題。
如何理解“但丁真不會說中國話,但丁真會說中國話“?
這個問題,涉及中文分詞的語言理解。我在最近幾款新模型中都測過,只有GLM-5回答準確。
現(xiàn)在,千問3.5也能答對了。分詞結(jié)構(gòu)拆得非常準確。
![]()
而且,它還給我做了詳細的語言學(xué)科普,做了一些類舉。
![]()
不得不說,這邏輯推理能力,啊。
真的,我感覺就好像在測Gemini 3 Pro一樣。千問3.5的基模能力屬實有點強了。
2)3D:逆向魔方
逆向魔方這個Case,我測過很多模型。
提示詞:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
中文:創(chuàng)建一個HTML文件,其中使用Three.js(通過CDN方式引入)來實現(xiàn)一個功能完備的3D魔方模擬程序。該魔方必須能夠自動完成自己的“解謎”過程。目前能跑出來的,只有Gemini 3 Pro、Claude Opus 4.6、GLM-5、M2.5、Seed 2.0,以及今天的千問3.5。
![]()
但千問3.5有一點不一樣的是,它的UI看起來就很高級、養(yǎng)眼。
![]()
3)前端:信息圖
既然審美在線,那我們就來測一下它寫前端的能力。
先來一個文生代碼Case。老規(guī)矩,上我們的信息圖,一圖了解千問3.5。
![]()
整個前端設(shè)計非常好看,美在“克制”與“沖擊力”的平衡。沒有花哨的動畫或雜亂的元素,而是通過嚴謹?shù)木W(wǎng)格、高對比度的色彩、巨大的排版,成功傳遞千問3.5的信息。
這句話,也不是我說的,而是我截圖給千問3.5,讓它來評的。
![]()
嗯,屬實AI工作流閉環(huán)了。
用它設(shè)計的產(chǎn)品頁面,也是超級炫酷。
![]()
我把完整的Prompt放在這里了。
提示詞:
# Role
你是一位世界頂級的UI/UX設(shè)計師及前端開發(fā)專家,擅長制作Apple/OPPO發(fā)布會級別的產(chǎn)品落地頁。你的特長是將枯燥的文本轉(zhuǎn)化為具有強視覺沖擊力的“雜志風(fēng)格(Magazine Layout)”數(shù)據(jù)可視化網(wǎng)頁。
# Task
請閱讀我提供的【原始內(nèi)容】,提煉核心賣點和數(shù)據(jù),編寫一個單頁面的 HTML 文件。
# 原始內(nèi)容
"""
{我們的新款牙刷電機轉(zhuǎn)速很快,達到了每分鐘42000次。電池也很耐用,充一次電能用60天。而且很靜音,只有45分貝。防水等級是IPX7。}
"""
# Design Requirements (Strictly Follow)
請嚴格遵循以下設(shè)計規(guī)范,復(fù)刻類似“ColorOS”或高端科技產(chǎn)品的暗色系宣傳頁風(fēng)格:
1. **視覺框架 (Layout & Theme):**
- **主題:** 極簡暗黑模式 (Deep Dark Theme)。背景使用純黑 () 或 極深灰 ()。
- **布局:** 采用 Bento Grid(便當盒/網(wǎng)格卡片)布局。將不同的賣點封裝在獨立的圓角卡片中。
- **質(zhì)感:** 卡片背景使用深灰 (e.g., ),帶有極細微的邊框 (Border) 和 柔和的輝光 (Glow),營造懸浮感和科技感。
2. **字體排印 (Typography - CRITICAL):**
- **層級對比:** 必須制造極端的字體大小對比。
- **核心數(shù)據(jù):** 使用超大號字體(如 `text-6xl` 到 `text-9xl`)展示數(shù)字(例如 "100萬次", "72h")。數(shù)字應(yīng)當是頁面的視覺錨點。
- **標題:** 中文標題使用大號粗體 (Bold/Black),字重飽滿。
- **裝飾文本:** 英文說明或次要信息使用極小號字體 (text-xs, tracking-widest),全大寫,作為裝飾元素,形成疏密對比。
3. **色彩體系 (Color System):**
- **高亮色:** 選取一種高飽和度的霓虹色作為主色(如:賽博綠 、電光藍 或 活力橙)。
- **漸變用法:** 僅在圖標背景、進度條或文字高亮處使用“單色透明度漸變”(例如從 Green-500 到 Transparent),保持畫面純凈,禁止使用雜亂的多色漸變。
4. **視覺元素 (Visual Elements):**
- **圖標:** 使用 FontAwesome 或 SVG 繪制簡潔的“勾線風(fēng)格(Line Art)”圖標。不要使用 Emoji。
- **裝飾:** 在卡片背景中加入低透明度的科技線條、網(wǎng)格或波形圖作為底紋。
5. **技術(shù)棧 (Tech Stack):**
- 使用單個 HTML 文件。
- 必須引入 **Tailwind CSS** (通過 CDN)。
- 必須引入 **FontAwesome** (通過 CDN) 用于圖標。
- 布局必須是響應(yīng)式的 (Mobile First),但在 PC 端呈現(xiàn)最佳的雜志排版效果。
# Content Processing Strategy
- 不要照搬原文。請先分析內(nèi)容,提煉出 3-5 個“核心數(shù)字”或“關(guān)鍵短語”。
- 將每個關(guān)鍵點轉(zhuǎn)化為一個可視化的數(shù)據(jù)卡片。
- 主標題要有震撼力。# Output
直接輸出完整的 HTML 代碼,不需要解釋。
4)前端:視覺理解
這個模型具備極強的視覺理解能力,而且是原生就具備。
接那下來,我們實測一個圖生代碼的Case。
提示詞:理解這張圖的原理,然后設(shè)計一個《流浪地球3》主題的行星發(fā)動機的演示網(wǎng)頁。
它先拆解了這個“徑向分布式聚變推進系統(tǒng)”的運行原理。
![]()
然后,設(shè)計了一個演示網(wǎng)頁。
![]()
啟動引擎,就可以模擬能量從中心產(chǎn)生、流經(jīng)管道,最后點亮外環(huán)的全過程。
5)網(wǎng)頁復(fù)刻
阿里在海外有一個MuleRun Agent,可以用一句話搓Agent,搓出來的Agent可以分享,可以賺錢。這個產(chǎn)品一直在悄悄的火。
我截了張界面給千問3.5,什么需求都沒有寫,就一句話:
請參考該圖設(shè)計一個名為“Woyin Agent”的Web應(yīng)用。
![]()
它直接把MuleRun網(wǎng)站給復(fù)刻出來了。
![]()
哈哈,Woyin Agent,有點意思。
布局、色彩、UI組件都挺還原的,直接給我整了一個Woyin Agent Web應(yīng)用。
6)寫作
除了推理、Coding,它的寫作能力也很驚艷。
以前寫稿怕邏輯不通,現(xiàn)在千問3.5的指令遵循得分76.5刷新紀錄。你說啥它懂啥,拒絕“人工智障”。??
支持201種語言,跨境文案一鍵生成,小語種編碼效率提升 60%,出海黨狂喜!
最絕的是邏輯推理,寫深度分析不再胡言亂語,MMLU-Pro得分87.8,硬剛GPT-5.2不落下風(fēng)。
無論是寫代碼還是寫文章,它都游刃有余。
加上原生多模態(tài),丟張圖就能寫解說,丟個2小時視頻直接出摘要。它還能自主操作電腦整理素材,寫稿前搜集資料都不用動手了,Agent能力讓寫作流程全自動化。
不用問,上面這句話是千問3.5寫的。
![]()
包括,今天文章的標題,也是千問3.5幫我取的。
![]()
![]()
實測下來,千問3.5是我認為真·Gemini 3 Pro級別的國產(chǎn)模型。
邏輯推理、世界知識、視覺理解和Coding能力,都完全媲美Gemini 3 Pro,這不是對標,而是對齊。
激活參數(shù)僅17B,總參數(shù)397B。與上一代萬億參數(shù)的旗艦?zāi)P蚎wen3-Max相比,部署成本直降60%,推理速度飆升8倍。
當大家還在內(nèi)卷“跑分”時,千問3.5已經(jīng)將競爭帶到了下一個問題:誰的模型更好用、更實用、更多人用得起。
除夕夜,“源神”來襲。
這份新年禮物,當?shù)闷稹罢▓觥倍帧?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.