阿里半夜剛發(fā)完旗艦Qwen模型,行業(yè)解讀數(shù)據(jù)還沒出來呢,DeepSeek 凌晨就甩出一個升級版 DeepSeek-OCR 2,而且用的正是阿里的 Qwen。
香檳還沒來得及開,就被人拿去干活了。
![]()
![]()
這個時間點,明顯不是偶然
但DeepSeek沒有硬鋼大模型參數(shù),而是選擇了:OCR。
更有意思的是:它用的不在自家模型,而是Qwen2-0.5B。DeepSeek團隊在論文中自己也說了,這就有意思了。
![]()
注意這個數(shù)字:0.5B。
在今天這個動不動就幾十 B、上百B的年代,這個模型規(guī)模說白了是很小、很小了。但 DS 就用這么個配角,干了一件讓行業(yè)震驚的大事。
DeepSeek 讓AI學會了抓重點
去年10月DS團隊就發(fā)布了OCR1,把圖像壓成少量token喂給AI,取得了巨大的成功,說明方向是對的,但大家沒當回事。
但這次不一樣了。DeepSeek-OCR 2是在行業(yè)內(nèi)做了個大創(chuàng)新:是讀圖,是先推理圖的閱讀順序。
![]()
- 傳統(tǒng) OCR 是什么?不管是風景還是文字,一律先掃一遍,這樣挺浪費算力的,
- 而這次OCR2解決的是:圖片上哪里可能有信息、哪個地方更重要、哪些地方可以不看,屬于邊看邊理解。
最反常的地方:只用了 0.5B
很多人覺得0.5B太小了,用起來沒面子。
但在內(nèi)行人眼里看:DeepSeek只用了Qwen2-0.5B的數(shù)據(jù)就搞定了 OCR2,這意味著法拉利加兌了水的柴油,也能跑到極速。
![]()
- 舉個例子:如果用70B的大模型識別圖片,識一張圖可能要5分錢;但用Qwen2-0.5B,成本可能連5厘錢都不到。而且0.5B的模型非常小(大概就幾百MB),這意味著你手機上、汽車芯片里,可以直接裝了,幾百塊錢就能搞定。
DeepSeek團隊能把Qwen2-0.5B玩出花來,說明是真本事!
其次,程序員也喜歡用0.5B小模型,因為這款模型穩(wěn)定、成本低、好部署,特別適合二次開發(fā)。
- 所以這件事至少說明了三點:
- (1)說明DeepSeek根本不在乎底座是不是自己的,只要能用就行,非常務實。
- (2)說明AI模型不在參數(shù)多大,0.5B的袖珍級模型,一樣創(chuàng)造神話。
- (3)也是最容易被忽略的一點:越來越多關(guān)鍵項目,開始默認用阿里的Qwen了。
這條路一旦走通,誰會最先倒霉?
DeepSeek OCR 2 這種路線一旦跑通,那將對許多行業(yè)的影響是致命的。
- (1)銀行領(lǐng)域,尤其是放貸,一個人要看一天,一旦用上了OCR配合AI,那么幾秒就能出結(jié)果了。
- (2)醫(yī)療領(lǐng)域,那些老大夫?qū)懙牧什莸臐h字、化驗單,用OCR+AI就能猜出醫(yī)生開的是什么藥。
- (3)自動駕駛領(lǐng)域,汽車可以更輕松的讀路牌、讀紅綠燈、讀儀表板,以后的識別率會更高。
- (4)教育領(lǐng)域,孩子手寫作業(yè)、試卷批改,老師的重復勞動會被快速壓縮。
![]()
(AI眼中的路牌)
真正致命的,是它把成本打下來了
你可能會說:這些功能以前不也有嗎?
有,但不一樣。
![]()
這意味著:DeepSeek OCR2的識別準確率提升到 91.09%,整體成本至少下降 50%。
更意味著原本只有大公司能用的起的OCR,現(xiàn)在小團隊也能用的上來。如果 OCR 2 這條路走通了,大模型的整體使用成本,很可能在降低50%。
Qwen,正在悄悄變成底座!
它的優(yōu)勢不是“新”,而是:體積小、性能穩(wěn)定、好適配、工程友好。
以前很多視覺識別、自動駕駛,必須聯(lián)網(wǎng)、必須高算力。而在DeepSeek團隊的這種思路下:不聯(lián)網(wǎng)也能用、算力更低、價格更便宜了。
- 而且DeepSeek可不是個例:
- (1)日本的Abeja,用 Qwen 訓練出了多個日語大模型,成了日本當?shù)氐摹皣浿狻薄?/li>
- (2)英國牛津大學OxValue.AI公司也用Qwen做了一套財務估值系統(tǒng)。
DeepSeek 是這兩年國內(nèi)最激進的一家開源模型團隊。他不愛卷模型、特別喜歡改結(jié)構(gòu),幾乎所有的模型都直接開源了。
別人拼的是誰的模型更大、誰的算力更牛,可DeepSeek拼的是:用最少的錢,干最多的活。
這次 OCR 2,本質(zhì)也是這個思路。
最后你會發(fā)現(xiàn),Qwen 從來不靠吆喝,但它已經(jīng)悄悄進了無數(shù)產(chǎn)品的底層。真正改變行業(yè)的技術(shù),往往不是被討論最多的那個。
![]()
盧松松是一位自媒體人、短視頻博主。也是創(chuàng)業(yè)者必看的賬號,關(guān)注草根創(chuàng)業(yè)圈、科技互聯(lián)網(wǎng)、自媒體和短視頻行業(yè)。感謝您的關(guān)注!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.