![]()
在當下規模空前的AI競爭里,“大模型”成了所有公司的默認答案。大家都在升級算力、打榜、搶占各種入口。然而就在行業敘事越來越收斂時,一家幾乎把所有主流做法都否定掉的創業公司出現了——Chance AI。
創始人曾熙把輸入框從首頁刪掉,做了個不需要你發問的AI App,只用抬手一拍,就能幫你以文字解讀任何看到的東西,這更符合直覺。
現場,曾熙用拍了一對球鞋Air Jordan 1的圖片,Chance AI告訴我們它值30萬美金,為什么?這是在喬丹當年總決賽穿的那一對;它還能幫女生看穿搭。出門前自拍一張,App能告訴她,這個搭配如果換一個顏色的圍巾, 或者再加一個什么顏色的包搭配度更高。
很快,在被北美大學生圈粉后,團隊又奔著年輕一代的呼聲,開發了點評OOTD(每日穿搭)、看手相、看膚質、毒舌點評等一系列功能。
光解讀不算完,用戶還可以一鍵分享到Chance AI自帶的社區,“所見”成了用戶自己的談資,一群18-25歲的年輕人也由此聚到了一起。
CTO吳曉凡向華爾街見聞透露,Chance AI已經在全球吸引了25萬左右的用戶。
由此,一個Google Lens+小紅書、Instagram的形態漸漸成型,Chance AI也初步集齊了爆款要素。而且年輕人用得越多,就越是能捕捉到他們真實的需求,曾熙說,“我們二十多萬用戶,每個北美女生平均每天會拍2.8次穿搭,這個數據量是多么恐怖”。
手握大廠和電商們夢寐以求的富礦,但曾熙和團隊卻沒急于變現,也不打算盲目追眼下大火的AI硬件之風,甚至暫時不敢搞更大規模的宣傳,怕基建一時撐不起“潑天的富貴”。
他們打算繼續打磨自家的視覺Agent,把這個“視覺大腦”開發得更強大,繼而積累更豐富的數據,形成視覺社區,加速起“滾雪球”。
在AI產品逐漸同質化的當下,曾熙成了逃離主流敘事的少數派,卻挖到了人類直覺的共識:如果人類有70%的大腦帶寬用于處理視覺,那AI的未來入口就不應該繼續被一個輸入框壟斷。
Chance AI的選擇或許激進,但在一個日益內卷的賽道里,反而因為稀缺顯得更值得觀察。
把交互拉回視覺本能
當行業已經習慣用“人提問,AI回答”的方式來定義產品邊界時,Chance AI創始曾熙向華爾街見聞提出一個問題:“為什么眼睛不長在屁股上?”
因為在人類的進化邏輯里,視覺才是第一性原理,而語言只是更晚出現的編碼系統。
曾熙提到,從進化角度來看,人類大腦中約有 70% 的信息處理與視覺相關——在語言出現之前,人類已經依靠視覺來識別環境、判斷危險與機會。
過去十年,所有主流交互方式都被輸入框標準化了。用戶必須提前知道問題是什么,必須把需求翻譯成語言,再把語言交給一個模型。
對大多數人來說,這種方式并不自然。人在街上看到奇特的建筑、看到陌生的藝術、看到一個模糊的符號,第一反應是“被吸引”,而問題則是在注意力之后產生的。
曾熙就說:“提示詞是為懶惰的AI準備的。”
他的意思并不是攻擊prompt生態,而是認為,大部分時候prompt是人在幫模型工作,是在補齊模型缺失的推理鏈條。如果AI真夠聰明,它不應該依賴人教它“怎么問”,它應該能夠通過視覺線索主動理解用戶的關注點。
曾熙向華爾街見聞講了一個故事。他說自己是藝術愛好者,兩年前曾經自己為辦展而做了一個AI掃描講解的小程序。然而撤展后,曾熙發現居然還有1500多人在用那個小程序,調研后他發現,用戶這些用戶已經形成肌肉記憶,用它來掃描各種花草、電影、服飾,繼續跟AI聊。
事實上,曾熙身上就有很重的設計師責任感,“我們的使命就是消除科技和人之間的隔閡。AI 在很多人眼里可能有點‘高冷’,但我的目標是讓它變得更自然、更貼近人類的本能需求——用視覺去理解和探索世界。”
基于這個判斷直接決定了產品形態。Chance AI從第一天起就把輸入框從核心界面移除。
“看”成為默認動作,“問”變成可選動作。用戶不需要組織語言,不需要提前構造問題,也不需要費力去尋找“AI最喜歡的提問方式”。在行業幾乎所有人都在加強語言交互時,這個決定顯得非常逆勢。
但也正因如此,它避開了大多數模型擠在一起的賽道。輸入框代表的是目的性,而視覺代表的是本能;輸入框強調解決問題,而視覺強調觸發好奇。Chance AI的交互方式與其說像工具,不如說更像一種認知肌肉的訓練。
然而,先行者也承擔著風險。眼下行業已經在語言交互上建立了完整的用戶路徑,從搜索到電商再到助手模式,用戶也被訓練得越來越依賴“提問題”。
視覺能否真正成為新的入口并沒有確定答案,硬件形態也沒有成熟。但在一個高度統一的賽道上,Chance AI至少試圖讓問題重新變得開放,而不是跟著所有人一起繼續把交互壓成一個框。
從識別到意義推理
Chance AI真正的非共識之處,并不在于它使用了攝像頭,而在于它把“解釋意義”當成了AI的核心能力。
曾熙說,他創辦 Chance AI 的靈感要追溯到小時候對《蒙娜麗莎》的一次觀摩。“當我站在尺幅比想象中小很多的她面前,滿懷期待卻完全看不懂其中的意義,‘不就是這么小一張畫,有什么了不起的’,匆匆看了一眼就走了”。
“人類是視覺動物,也是故事動物,我們天生會被眼前的景象吸引,但真正觸動我們的是其背后的故事”。后來,當曾熙有機會深入了解了達芬奇和這幅畫背后的故事,終明白它為何被稱為人類文明的瑰寶。
曾熙說,Chance AI 的使命是用科技幫助人們發現這些隱藏的故事,消除人與世界之間的隔閡。至于 “Chance” 這個名字,它并不僅代表“機會”,更代表“偶然性”(contingency)。
在他看來,生物進化的過程依賴于偶然性,而人類知識與創意的誕生,也常常來源于這些偶然的碰撞。Chance AI 希望通過連接視覺與故事,加速這些知識的交匯,讓每一次視覺體驗都更加深刻而有意義。
回溯來看,過去一年整個行業在多模態方向大幅前進,主流模型對圖像的識別、標注、描述都變得越來越準確。然而在曾熙看來,所有這些能力幾乎都有一個共同的上限:它們能說清“這是什么”,但很難進一步解釋“它為什么重要”。
人類對世界的理解從來不是停留在事實層面。無論是電影解說、球賽評論、旅行導覽還是藝術講解,人之所以需要這些角色,是因為它們幫助我們把事實轉化為意義,把信息解壓成故事,把看到的東西與更大的文化體系建立聯系。在這個意義上,視覺就是一種推理方式。
Chance AI的產品在這里做了一個明顯的選擇。它并不滿足于給出一個客觀描述,而試圖把一個物件的知識背景、文化語境、社會共識都調動起來。
曾熙向華爾街見聞舉例:一個石頭不再只是“混凝土上放著的巨石”,而是洛杉磯LACMA的LevitatedMass,是花了一千三百萬美元運輸的公共藝術,是關于美國城市階層結構的隱喻。一棟樓不只是“未來主義摩天大樓”,而是扎哈·哈迪德的遺作之一,是紫荊花含苞待放的象征。
這種解釋并并非模型自動生成的,而是一種主動的意義推理。它的前提是模型愿意介入、愿意解釋、愿意冒一定的主觀風險。這恰恰是主流模型最不愿意做的。
在業內人士看來,大廠模型的策略極其保守,更傾向于提供安全、標準化、無爭議的信息;而解釋本身意味著主觀性,也意味著爭議,這對于大型商業產品來說會放大風險。
這也是為什么“意義推理”一直是行業的灰色地帶。大公司不做,并不代表它們不能做,而是做了反而可能帶來成本。Chance AI的定位讓它有能力承擔這些“不確定的解釋”,也讓它在“視覺理解”這條路上走得比別人更遠。
但這種模式的局限也顯而易見。文化語境可能出現偏差,意義敘述可能變成一種新的“AI算命”。模型越往“解釋”走,越需要在深度和準確性之間找到平衡。對大廠來說,這是不能冒的險,對Chance來說,這是必須承擔的邊界。
但正因為它站在巨頭最不愿意涉足的區域,它反而擁有一個罕見的時間窗口。它試圖回答的是“AI能否提升人的理解力”。它確實擊中了一部分人真正的需求:在一個溢滿信息的世界里,判斷比答案更稀缺,理解比速度更重要。
Chance AI的問題在于,它的路線需要耐心,需要生態,需要硬件,需要文化習慣的遷移。它的優勢在于,它比別人更早意識到,AI的下一次入口變化,可能發生在視覺。
在一個所有公司都押注語言模型的時代,這個判斷顯得孤獨,但也因此值得被記錄。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.