![]()
如果生成能力會越來越便宜,代碼會越來越像流水,功能會越來越容易被復制,甚至連 “聰明”本身都將成為一種隨手可取的公共資源,那么最后還能拉開差距的,到底是什么?
很多人以為,AI 對軟件行業(yè)最大的沖擊,是讓開發(fā)更快、成本更低、產(chǎn)品更多。可真正更深的一層變化是,一旦越來越多的軟件都在調用相似的大模型能力,真正稀缺的就不再是“會不會做”,而是“做成什么樣”、“讓人如何使用”、“怎樣把復雜能力組織成一種順滑、可信、上癮的體驗”。
到了那時,決定勝負的,可能不再是后臺那顆大腦本身,而是你如何把這顆大腦包裝成一個用戶愿意反復進入的世界。
這正是當下最值得警惕也最值得興奮的轉折點。軟件行業(yè)正在從“功能競爭”滑向“界面競爭”,從“誰擁有更多工程師”滑向“誰擁有更高明的抽象能力”,從“堆人堆資源”滑向“少數(shù)人駕馭智能體高速創(chuàng)造”。
設計師開始寫代碼,產(chǎn)品經(jīng)理開始直接調用工作流,原本涇渭分明的分工被迅速打散。一個小團隊,甚至兩個人加上一群智能體,就可能在極短時間內做出過去需要整套組織架構才能完成的原型、產(chǎn)品和服務。軟件的制造方式,已經(jīng)在靜悄悄地變種。
更重要的是,這場變化并沒有首先以某種驚天動地的新界面降臨。你沒有看到一個像鼠標、觸屏那樣一眼就能定義時代的新發(fā)明。
真正的斷裂,先發(fā)生在更深處。它發(fā)生在工作流里,發(fā)生在角色邊界里,發(fā)生在產(chǎn)品從概念走向上線的速度里,也發(fā)生在“誰有資格定義產(chǎn)品”這件事上。過去,設計師負責畫圖,工程師負責實現(xiàn),產(chǎn)品經(jīng)理負責協(xié)調。
現(xiàn)在,這幾條鏈路正在被壓縮到同一種人手里。誰更懂用戶意圖,誰更懂取舍,誰更懂得把能力變成體驗,誰就更接近新的權力中心。
《Fast Company》記者馬克·威爾遜今年二月親赴舊金山,做了一次深度調研,他背靠背走訪了Anthropic、OpenAI、Cursor、Krea 等公司,試圖搞清楚一件事:AI 到底把設計這件事,改成了什么樣子。
他找到的答案,比大多數(shù)人預想的還有具有顛覆性。
Cursor 的設計主管 Ryo Lu,一周內只和另一個人,就用 AI 重建了一個原型——對象就是估值 293 億美元的 Cursor 本身。蘋果前工業(yè)設計師 Abs Chowdhury,剛剛發(fā)布完 iPhone Pro,第二年就去新公司"氛圍設計"UI,不再需要工程師幫他把概念變成現(xiàn)實。
另一位前蘋果設計師Jason Yuan說:他在給新公司融資的時候,突然覺得自己融多了,因為兩個人加上AI,就能干完過去需要二十個人干的活。
這不是"AI 提升效率"的陳詞濫調。這是一次權力結構的重新洗牌。
設計師正在重新拿回話語權,不是因為他們學會了什么新工具,而是因為 AI 讓"從想法到代碼"這條路,第一次不需要工程師的許可。代碼本來是設計師和現(xiàn)實之間的那堵墻,現(xiàn)在這堵墻正在消失。
但消失的同時,另一個問題浮出水面。設計師重新拿到了槍,子彈卻是借的。
當Krea、Cursor 這類公司的護城河變成"界面",當它們接入的模型只需要修改一行代碼就能替換,當 Anthropic 和 OpenAI 同時在擴張自己的產(chǎn)品矩陣,把同一顆大腦塞進越來越多的入口,那個真正值錢的東西,到底在哪里?
Krea 的 Victor Perez 給出了他的賭注:不是模型本身,而是模型的"品味"。他花了整整一年和 Black Forest Labs 合作,微調出一個有獨特審美偏好的 Krea 模型,為了讓 AI 生成的圖像不再千篇一律地像 AI 生成的。OpenAI 的 Darin Fisher 說得更哲學:當 AI 替你處理所有瑣碎細節(jié),這本身不就是一種界面的范式轉移嗎?
但威爾遜沒有給出一個干凈的答案。沒有人給出。
Anthropic 設計主管在文中說了一句讓人難忘的話:他采訪了幾十位 AI 設計師,每個人進來都說"我想做聊天之后的下一個范式",但他沒有找到一個真正超越聊天框的答案。
Krea的Perez說得更直白:我們現(xiàn)在仍處于"獲取能力的階段",真正的界面革命,還要等 AI 速度再快一百倍。
這篇文章真正討論的,并不只是設計行業(yè)會怎樣被 AI 改寫。它討論的是,當智能本身越來越像水電煤一樣流向一切,什么東西會成為新的稀缺資源。
答案很可能是界面,是抽象,是品味,是工作流,是把一團巨大而混沌的能力,整理成一個普通人也愿意進入、愿意停留、愿意信任的入口。
未來的軟件世界,很可能會越來越像今天的媒體、品牌和消費品世界。你表面上在賣功能,深處其實在爭奪用戶的認知、注意力和依賴。
當所有軟件都接上同一顆大腦,真正值錢的,也許就是那只看不見的手。它決定用戶先看到什么,理解什么,忽略什么,相信什么。它決定一項能力最終是變成冷冰冰的基礎設施,還是變成一個有吸引力、有黏性、有護城河的產(chǎn)品宇宙。
這也意味著,未來最貴的資產(chǎn),未必是模型本身,而是把模型馴化為體驗的人。
分享下fastcompany最新的這篇深度特寫報告。
![]()
‘We just have to experiment faster’: AI’s changed design forever. Now what?
“我們只需加快實驗的步伐”:AI 已經(jīng)永遠改變了設計行業(yè)。接下來呢?
設計師現(xiàn)在成了程序員——或者說最好成為程序員。你的界面要么是護城河,要么變得無關緊要。帶你深入探究 AI 是如何顛覆設計行業(yè)的這場令人眼花繚亂的洗牌,由 Anthropic、OpenAI、Cursor、Krea 等公司的高級布道者們領銜的精彩大戲。
作者:馬克·威爾遜(Mark Wilson)
我可能剛剛見證了近年來最偉大的界面突破。也可能沒有。但我確實有這種感覺?
一切發(fā)展得太快了,很難說得準。
炙手可熱的編程工具 Cursor 的設計主管 Ryo Lu 邀請我來到了他們位于舊金山、以炭灰色為主調的工作室。還沒來得及和任何人打招呼,我就在這個需要脫鞋的開放式辦公室門口看到了一堆鞋子。我突然有些后悔,今天沒穿襪子就套上了我的新百倫樂福鞋。
Lu 說話輕聲細語,穿著被創(chuàng)意人士奉為標配的寬松闊腿褲和紐扣襯衫。他帶著我穿梭在辦公桌之間,路過了一排數(shù)量堪比半個運動酒吧的系統(tǒng)正常運行時間監(jiān)控器,以及一個擺滿了小物件的架子,上面放著一張 New Jeans 的唱片和一臺邦迪藍配色的 iMac。
也許你是個普通人,甚至沒聽說過 Cursor。這沒關系。這是一家站在 AI 編程浪潮最前沿的初創(chuàng)公司,如今許多人相信這股浪潮將重塑我們所認知的軟件。Cursor 的目標群體是專業(yè)的開發(fā)團隊,但當我們坐在他的辦公桌前時,Lu 承認這種優(yōu)勢同時也是一種劣勢。
如果你注冊 Cursor 只是為了進行一些隨性的“氛圍編程”,你很可能會被軟件中無處不在的命令行和首字母縮寫詞弄得暈頭轉向。[譯注:vibecoding,指不強求理解底層邏輯,憑借直覺、自然語言和 AI 輔助來快速生成代碼的編程方式。]
Lu 提出,他可以用他的新項目來化解這種張力,他稱之為“寶貝 Cursor”。Lu 將寶貝 Cursor 視為公司軟件(于 2023 年首發(fā))的下一代產(chǎn)品。當他加載它時,我沒有看到任何令人生畏的代碼框。
我主要看到的只有一個提示詞輸入框。只需輕輕一點,設計師就能調出一個應用程序并重新排列其組件,隨后它會以代碼的形式吐出更新。或者,產(chǎn)品經(jīng)理可以加載一份項目摘要,將目標轉化為具體的工作流。實際上,任何人都可以調出一個智能體(Agents)團隊來協(xié)調工作,而自己則可以悠閑地去喝杯抹茶。
Lu 在他的作品中快速穿梭,展示了寶貝 Cursor 如何最終展開為一個龐大的工作站——與現(xiàn)在的 Cursor 界面頗為相似——或者縮小成一個潛伏在你屏幕角落的助手。Lu 將 Cursor 的未來想象成一把無限的“瑞士軍刀”,每個窗口都提供服務的不同側面:一個擁有十幾種不同面孔的 AI,全部接入同一個引擎,為任何受眾提供最完美的界面。
“我腦子里想的,就是讓 Cursor 同時成為最簡單的東西和最瘋狂的東西,”他說。
但寶貝 Cursor 最瘋狂的部分甚至不是它的設計。而是 Lu 僅僅花了一個星期,而且只和另一個人(李·羅賓遜,Lee Robinson)一起,就做出了這個原型。再讀一遍這句話:一個兩人的團隊,在一周內,重建了目前估值 293 億美元的 Cursor。
對我們大多數(shù)人來說,AI 革命的意義可能僅僅局限于對話式搜索引擎、自動撰寫的電子郵件以及源源不斷的多媒體“賽博垃圾”,但在硅谷,它正在徹底顛覆產(chǎn)品開發(fā)。軟件構建的方式不僅發(fā)生了改變;它還經(jīng)歷了指數(shù)級的加速。現(xiàn)在,設計師可以是程序員,也可以是產(chǎn)品經(jīng)理,開發(fā)過程可以一步到位,直接從概念走向生產(chǎn)。
在我二十年的報道生涯中,我曾無數(shù)次造訪舊金山。但在三年前的一次旅行中,我感覺世界發(fā)生了一些偏移。在 2023 年 ChatGPT(一種大型語言模型)席卷主流之后,我參觀了 AI 革命的“原爆點”,對各大初創(chuàng)公司進行了 72 小時的巡禮,試圖理清 AI 將如何影響設計的未來——并由此推及人們將在生活中體驗這項新技術的方式。
僅僅三年前,設計師們還在極富詩意和哲學深度的討論中抽絲剝繭地探討這些想法:大語言模型(LLM)到底是什么?除聊天之外,你還能用一臺無所不知的機器做什么?如果 AI 成為軟件背后的引擎,它的觸點將如何轉變?yōu)槲覀儚奈聪胂筮^的形態(tài)?
隨后在今年 2 月份,我以設計記者和 AI 觀光客的雙重身份重返此地,發(fā)現(xiàn)人們現(xiàn)在談論的重點已經(jīng)變得非常具體。我背靠背地參加了包括 OpenAI 和 Anthropic 在內的 AI 巨頭會議,同時也拜訪了追逐下一個風口的投資者和初創(chuàng)公司。在幾個場合中,我甚至找回了三年前的采訪對象,看看他們的觀點發(fā)生了哪些改變。
下面的文章是對他們觀點和我個人觀察的綜合。你可以把它看作是 AI 時代精神的一個縮影,以及對當設計師同時也成為軟件開發(fā)者時會發(fā)生什么的一種預測。
正如創(chuàng)立了社交 AI 初創(chuàng)公司 Future Lovers 的前蘋果設計師杰森·袁(Jason Yuan)告訴我的那樣:“對于作者型創(chuàng)作者(auteur)來說,這是最好的時代。”[譯注:auteur 源自法語,原指擁有極強個人風格的電影作者,這里指能夠獨立掌控產(chǎn)品全局的頂尖創(chuàng)作者。]
![]()
“氛圍轉變”的背后
相比于 2023 年舊金山那種近乎后世界末日的氛圍,這座城市最近經(jīng)歷了一次徹底的風向轉變(vibe shift)。迎接我的是我?guī)缀跽J不出的街道,無數(shù)風險投資資金吸引了新一代年輕企業(yè)家在這里重新建設。公園里現(xiàn)在擠滿了人。
二十多歲的年輕人在曾經(jīng)廢棄的店面外排隊,購買 7 美元的牛角面包和 45 美元的套餐——對于 IPO(首次公開募股)前的人生來說,這是對錢包友好的奢侈享受。自動駕駛的 Waymo 汽車備受信任,甚至比人類駕駛的優(yōu)步汽車收費還要高。
這是一座正在駕馭自動化的城市,使用新的 AI 來構建新的 AI。與此同時,每位創(chuàng)業(yè)者都在擔心休假會讓自己被時代的列車甩下。從我短短幾天的所見所聞來看,這些擔憂似乎是有道理的。
你在舊金山能感受到的這種全新創(chuàng)造活力,是由風險投資行業(yè)注入的。僅在 2025 年,風險投資就向灣區(qū)的 AI 公司投資了 1220 億美元。龐大的風投行業(yè)本身也在快速擴張。
總部位于舊金山的投資公司 NFX 的創(chuàng)始合伙人詹姆斯·柯里爾(James Currier)表示,1994 年,風投公司只有 150 名普通合伙人;現(xiàn)在這個數(shù)字已經(jīng)超過了 3.3 萬。他說這是一個充滿“錯失恐懼癥”(FOMO, Fear Of Missing Out)的市場,因此,一家在 2022 年 A 輪融資中估值為 1800 萬美元的公司,現(xiàn)在的估值可以高達 1.4 億美元。
當柯里爾和我在三年前初次見面時,他睜大眼睛尋找著能像優(yōu)步利用智能手機改變交通那樣、利用 AI 改變我們日常生活的初創(chuàng)公司。然而出乎意料的是,我們看到企業(yè)家們大都傾向于一個“統(tǒng)御一切”的應用場景:氛圍編程。
“目前(投資的成功)在很大程度上是隨機的,因為初創(chuàng)公司太多了,風投公司也太多了,而且大家都長得差不多,”他說。
在我 2023 年的拜訪之后,似乎有一段時間 AI 領域并沒有發(fā)生什么大事。是的,每周都有新模型問世。是的,一代更比一代強。但沒有人真正證明 AI 將如何讓我們以截然不同的方式生活或工作。
這種情況在 2025 年 11 月 Anthropic 發(fā)布 Claude 4.5 時發(fā)生了改變。雖然開發(fā)人員多年來一直使用 AI 工具來輔助編寫代碼,但這次更新是一個轉折點。它更加可靠,也更容易通過提示詞進行引導。你第一次可以僅僅通過與 AI 聊天,就真正編寫出復雜的項目。
“即使 AI 從現(xiàn)在起停止進化,我們也還能看到它對世界產(chǎn)生另外 95% 的影響,”柯里爾堅持認為。他指的不僅是氛圍編程的影響,還有潛伏在現(xiàn)代大語言模型中尚未被挖掘的潛力。
你可以說氛圍編程就是那場革命,或者說氛圍編程是帶領我們走向那場革命的眾多工具之一。但有一件事是肯定的?在 AI 的這個原爆點上,氛圍編程已經(jīng)以美國中部地區(qū)未曾見過的方式改變了工作。與早期的投資熱潮不同,許多風投資金不需要用于資助龐大的開發(fā)團隊;它們可以直接被用來購買越來越多的 AI 代碼。
我原本以為,要釋放 AI 的力量,我們需要一套全新的交互模態(tài),就像鼠標引入了圖形用戶界面(GUI),或者多點觸控讓智能手機變得直觀易用一樣。但事實證明,今天的 AI 革命與按鈕、旋鈕或語音毫無關系。
AI 改變了工作方式,卻幾乎沒有改變前端 UI。它賦予了我們擁有編程智能體的能力,可以一次性烹制出數(shù)百行可靠的代碼,并與其他智能體協(xié)同工作,為新軟件注入生命。
毫無疑問,編程一直是 AI 最成功的用例。回想起來,這很合理。機器天生就懂機器的語言。
“我認為代碼最令人驚嘆的地方在于,它能為你創(chuàng)造有用的東西。它不僅僅是反饋給你一個答案或一句話,”Anthropic 的設計主管喬爾·萊文斯坦(Joel Lewenstein)說。“它是在實實在在地進行創(chuàng)造。”
智能是新的材料
坐在燈光昏暗的歌舞廳里,阿布斯·喬杜里(Abs Chowdhury)把他的 iPhone Pro 放在了我旁邊的桌子上。我看得出他在打量我選的顏色(橙色),這也合情合理,因為這玩意兒就是他設計的。這位前蘋果設計師就在去年還站在蘋果的舞臺上,發(fā)布他設計的 Pro 和 Air 機型。
去年 11 月,他被一份無法拒絕的邀約挖走,隨后這位工業(yè)設計師開始為他那個神秘的新 AI 初創(chuàng)公司 Hark(獲得了 1 億美元的資金支持)進行 UI 的“氛圍設計”。他坦言,在招募團隊和建立設計工作室的同時,他將 Photoshop 或 Illustrator 中的粗略設計直接轉移到 AI 代碼工具中,并通過代碼提示詞進行編輯。不再需要工程師來幫他把那些概念幻想變成現(xiàn)實了。
同樣,另一位前蘋果設計師袁感慨道,在了解到氛圍編程已經(jīng)變得如此強大之后,他覺得自己為新初創(chuàng)公司籌集的資金似乎太多了。在一家擠得連說話都聽不清的餐廳里,我們就著阿爾巴利諾葡萄酒和土豆湯,聽他詳細講述了他的公司 Future Lovers 是如何打造一種類似于 Pluribus 《同樂者》結合《緋聞女孩》的社交 AI 的。
自從 Claude 4.5 發(fā)布以來的五個月里,他主要依靠自己和 AI 一起構建他的第一款產(chǎn)品,只有一名編程顧問和幾名合同工協(xié)助——盡管他后來聘請了一名全職 AI 專家。(披露:我曾短暫擔任過袁上一家初創(chuàng)公司 New Computer 的顧問。)
“現(xiàn)在有一個籌集大量資金的新理由,那就是算力,”袁說。“如果你有堅定的信念,清楚地知道自己想要什么,那你為什么現(xiàn)在還要雇傭 20 個人來告訴你你在做什么?那純粹是協(xié)調成本。”
喬杜里和袁是兩位才華橫溢、擁有傲人職業(yè)履歷的設計師。他們是真正的匠人,精通設計工具,能夠微調我們大多數(shù)人甚至無法察覺的細節(jié)。但他們各自都擁抱了氛圍編程、氛圍設計或氛圍實現(xiàn)——不管你想怎么稱呼這個奇怪的東西——這一事實確鑿地證明了實踐方式的演變。
沒錯,喬杜里后來確實聘請了專門的界面設計師。但他們對這些工作流的熱情表明,一旦設計師開始像電影作者那樣用 AI 展現(xiàn)自己的想法,就很難再回頭了。正如袁所寫的那樣,智能是設計師進行創(chuàng)作的新材料。它正在成為一種媒介,就像上個時代的像素或鋁一樣,人們重塑它變得自然而然。
這種演變似乎必然會將權力從工程團隊拉回到設計師和其他產(chǎn)品愿景家手中。由于設計師本質上是在學習編程,在許多情況下,專業(yè)程序員正在從這個過程中被逐漸抽象和邊緣化。
這種抽象化正在為工程團隊制造張力,迫使他們在保持傳統(tǒng)專業(yè)知識的同時跨界掌握新的效率模式——這說起來容易做起來難。那一周的晚些時候,我拜訪了視頻游戲氛圍編程初創(chuàng)公司 Moonlake(該公司獲得了英偉達/NVIDIA 等公司 3000 萬美元的融資)。
兩位年輕的斯坦福(Stanford)研究生創(chuàng)始人告訴我,作為招聘流程的一部分,他們所有錄用的工程師現(xiàn)在都必須在他們面前當面寫代碼,而具體觀察他們如何使用 AI,是這份工作的重要考核標準。
“這其中的界限非常微妙。我們發(fā)現(xiàn)現(xiàn)在的程序員如果不太了解你的代碼,最終往往會搞崩整個代碼庫,”聯(lián)合創(chuàng)始人莎倫·李(Sharon Lee)說。“我們現(xiàn)在要確保一半的工程師使用(傳統(tǒng)的)手寫代碼,另一半則使用大量的工具。”
毫無疑問,推向市場的速度是促使人們決定用機器而非人力進行構建的許多原因所在。甚至連那些精益求精的工匠們也擁抱了設計界“快速行動,打破陳規(guī)”(move fast and break things)的時代,這與過去 30 年來追求完美主義的理念顯得格格不入。
“你不能再像過去蘋果那樣,打造那種讓人忍不住想舔一口的精美工藝和界面了,”袁說。“你做不到,因為等你為 ChatGPT 3 做好了最完美的界面時,時代已經(jīng)發(fā)展到 GPT 6 了。”
![]()
下一個偉大的界面(并不存在?)
我坐在 Anthropic 眾多陽光充足的會議室之一,手里緊緊攥著一杯果味淺焙咖啡,杯子是一個半釉陶瓷馬克杯。當產(chǎn)品設計主管喬爾·萊文斯坦用連珠炮般、極其樂觀的語調談論著他對 Claude 未來的愿景時,這種接地氣的泥土氣息感覺徹頭徹尾地不合時宜。
三年前,設計界的大部分人還在苦苦思索,是否會有一個偉大的 AI 界面來統(tǒng)治一切——也就是在提示詞框里跟大模型聊天之后出現(xiàn)的某種東西。當時硬件實驗層出不窮(安息吧,Humane 和 Rabbit),而關于所有界面的未來是否會是生成式的(即 AI 在任何特定時刻為你變出完美的新按鈕)爭論也如火如荼。
“有一個巨大的諷刺。很顯然,我招聘并面試了數(shù)十位 AI 領域的設計師,每個人進來(都說)‘我想做聊天之后的下一個范式!我有個好主意!’我見過了幾十種不同的方向,但沒有一個是真正超越聊天的東西,”萊文斯坦說。
他指出,即使是像 Claude Code 這樣被證明非常成功的產(chǎn)品,表面上看仍然是聊天的延伸。“所以我不知道這里的答案是什么。我們手里并沒有一個讓我 100% 確信就是聊天之后新范式的原型。”
就像它的競爭對手 OpenAI 一樣,Anthropic 正處于擴張期。主要的大模型提供商正在使他們的產(chǎn)品組合多樣化,就像微軟和谷歌在幾十年前擴展其服務一樣。Anthropic 并沒有通過單一的主力門戶或界面讓 Claude 自身做更多事情,而是將 Claude 拆分成各種不同的子產(chǎn)品,這些產(chǎn)品給人的感覺大同小異。
“我們有一個深受財務人員喜愛的 Excel 插件。它隱約有點像我們的 Chrome 擴展程序,Chrome 擴展又隱約有點像 Claude AI,而 Claude AI 又隱約有點像 Claude Code。但它們確實都是為不同的用戶量身定制的,”萊文斯坦說。
他指出,他們已經(jīng)將一套共享的設計語言編入了由 AI 驅動的開發(fā)流程中。“在這個階段,我們寧愿為四種不同的人群打造四款非常出色的產(chǎn)品,然后再考慮接下來怎么做,因為這樣可以讓我們學得更快,對吧?”
先發(fā)布,后學習:正是這種心態(tài),讓 Anthropic 在短短五天內就建立起新的 Claude Cowork 平臺。但這同時也意味著,Cowork 與 Claude 自身是脫節(jié)的,而非緊密整合。這是 Anthropic 必須向其自家受眾推銷的又一個新玩意兒。
“事情發(fā)展得太快了,我們別無他法,只能加快實驗的步伐,”萊文斯坦說。“大融合(Convergence)是很難的。因為你必須弄清楚什么是共享的部分。你必須構建那條共享路徑。其他系統(tǒng)上還有很多人們喜歡的邊緣功能。而且變化太多、太快了。”
坐著 Waymo 穿過小鎮(zhèn)后,我來到了 OpenAI。他們的辦公室位于一棟以前由優(yōu)步擁有的大樓里。雖然大多數(shù)保安都駐扎在前臺或門口,但 OpenAI 的安保措施甚至延伸到了人行道上。我來到一個從高樓層凸出來的封閉式門廊,在那里,我見到了或許是網(wǎng)絡瀏覽器背后最偉大的在世傳奇人物。
達林·費雪(Darin Fisher)隨意地坐在野餐桌旁,解釋了為什么他在 OpenAI 的設計方法并沒有那么激進。這位曾參與開發(fā)網(wǎng)景(Netscape)、Chrome 和 Arc 瀏覽器的幕后大腦,如今在擔任 OpenAI Atlas 瀏覽器的技術負責人。
他最緊迫的設計爭論之一是什么?AI 聊天框應該放在界面的哪一邊,左邊還是右邊?(平心而論,這個問題比乍看起來要令人困惑得多——但這仍然算不上是打破范式的工作。)
“我不是那種會問‘我們如何能改變一切?’的人,”他說。“我更多思考的是,如何從人們現(xiàn)有的習慣出發(fā)進行迭代?如何讓它變得更好?很多最終落地的東西,其實都是圍繞人們已經(jīng)習慣的中心,去優(yōu)化他們熟悉的工作流,這絲毫不會讓我感到驚訝。”
但緊接著,費雪審視了片刻自己的想法,給出了一個非常中肯的反方觀點。
“(AI)為你代勞的方方面面,讓你不必再深陷各種瑣碎細節(jié)之中,這本身不就是一種 UI 上的范式轉移嗎?” [譯注:原文為“in all the weeds”,俚語,指深陷錯綜復雜或極其瑣碎的細節(jié)中無法自拔。]
費雪說得沒錯。但 Anthropic 和 OpenAI——以及所有前沿大模型提供商——仍然面臨著一個非常確定的風險。他們正在重新創(chuàng)造一套各不相同、松散連接的服務,正是這套打法讓軟件巨頭在上個時代占據(jù)了主導地位(想想微軟視窗操作系統(tǒng) Windows、Teams、Outlook、OneDrive、Excel、Word 等)。誠然,這種策略擠掉了在法律和醫(yī)療等高度特定應用領域的競爭對手。但這已經(jīng)不是 90 年代或 21 世紀初了。
如今的軟件開發(fā)變得輕而易舉。因此,成為一個擁有三十個頭的平臺“九頭蛇”,反而讓這些前沿大模型構建者容易受到初創(chuàng)公司的攻擊。因為這些初創(chuàng)公司擁有更清晰的目標和施展拳腳的自由,能夠構建更全面、更清晰、更周到的服務,從而可能成為 AI 的主要觸點。
AI 行業(yè)從未預見的戰(zhàn)略
幾年前我第一次遇到巴塞羅那酷小孩維克多·佩雷斯(Victor Perez)時,他正在他商住兩用的公寓里用 La Croix 氣泡水罐堆砌高塔。他當時也在開發(fā) Krea,這是一款類似于 AI 時代 Photoshop 的軟件,它以毫不松懈的節(jié)奏將最新模型融入其中,承諾每周都會推出新功能。
如今,在獲得 5 億美元估值之后,他坐在了 Krea 位于漁人碼頭(Fisherman’s Wharf)的新辦公室里。這是一個二樓的磚墻空間,有一間玻璃會議室,透過百年歷史的拱形窗戶還能看到惡魔島(Alcatraz)的風景。
盡管有充足的自然光,佩雷斯依然將自己過去三年的生活戲稱為“穴居”。Krea 既賺錢又有價值,但佩雷斯(連同他那 37 人的團隊)仍在拼命工作。他看起來像是餓壞了,亟需一個三明治。
2023 年,當大多數(shù) AI 公司都在籌集資金試圖訓練大型 AI 模型時,Krea 采取了不同的策略。它構建了自己的軟件,然后接入了別人的 AI 模型。它打包了世界上許多頂尖的 AI 模型(如 Runway 和 Luma),提供前端體驗——要知道,在當時那些模型看起來都是封閉且受到嚴密保護的。
“做一個 API 套殼產(chǎn)品(API wrapper)這個想法對我來說其實并不明顯。我們是第一個這么做的,但我當時以為我們會挨告,”佩雷斯承認。“怎么可能所有這些公司花了幾百萬美元訓練這些系統(tǒng),卻不嘗試將這些系統(tǒng)植入到他們自己的產(chǎn)品中?我以為他們會這么做的!”
佩雷斯非但沒有挨告,反而收到了許多請求,要求將某些模型在列表中排名提前以獲得更多曝光。Krea 是首批證明某種架構行之有效的公司之一,如今這種架構已司空見慣:即一款軟件可以作為其他 AI 模型的交互界面。
Cursor 采取了類似的方法,通過應用層來占據(jù) AI 領域——和 Krea 一樣,它運行自己的一些 AI 模型,但也接入了 Claude 和其他第三方模型。由于 AI 模型的換入換出真的只需要一行代碼,因此像 Krea 和 Cursor 這樣的產(chǎn)品,即便在更好、更新的模型層出不窮時,也具備一定的生存能力。它們的護城河就是它們的界面。
佩雷斯承認,目前在 AI 領域,沒有哪種策略是萬無一失的。“人們,包括我們自己,在整合 API 并在此基礎上構建產(chǎn)品方面都非常成功,”他說。“但我感覺三年后,我們將不得不討論這樣一個問題:為什么在 2026 年這些 API 套殼被炒得火熱,而在 2029 年卻無人問津了。”
諷刺的是,盡管佩雷斯認為,在一個沒有人能指望與谷歌或 OpenAI 競爭的時代,開發(fā)模型對小型初創(chuàng)公司來說是一條死胡同,但他同時也認為擁抱模型開發(fā)才是 Krea 的未來。
他主張,如果不控制模型的核心杠桿,你就無法構建用于操縱 AI 的創(chuàng)意工具。這是因為前沿模型在后訓練(post-training)階段被微調的目的是為了實現(xiàn)跨任務的廣泛功能,而不是為某一種特定的視角服務——它們被打造得像流水線生產(chǎn)的“奇跡面包”一樣,只為了取悅最廣泛的普通大眾。[譯注:Wonder Bread 是美國一種常見的切片白面包品牌,常用來比喻平淡無奇、缺乏個性的工業(yè)化標準產(chǎn)品。]
因此,在 2025 年,Krea 與 Black Forest Labs(廣受歡迎的 Flux 模型的創(chuàng)造者)合作,協(xié)助微調了一個定制的 Krea 模型,本質上賦予了系統(tǒng)在多種風格上的“品味”。這種文本生成圖像(text-to-image)的工作流創(chuàng)建的圖像擺脫了明顯的 AI 感,讓照片更具真實感,讓插畫更有手繪感。
這種安排聽起來可能在技術層面上有些讓人困惑,但這種合作關系在商業(yè)界很常見:這不過是一次聯(lián)名合作!從鞋子到冰淇淋口味,公司經(jīng)常與外部設計團隊合作,將產(chǎn)品推向雙方單獨都無法達到的新高度。
佩雷斯將模型后訓練的過程比作使用 Pinterest。你通過教導算法你的喜好來定制你在 Pinterest 上的體驗。然而,定制訓練前沿模型的機會在當今行業(yè)中并不真正存在。這使得每個進行媒體創(chuàng)作的人只能任由工程師(而不是設計師)擺布,結果我們制造出了更多低質同質化的垃圾內容。
“你無法創(chuàng)造出比谷歌更聰明的模型,但你可以創(chuàng)造出更多品味——一個更有品味的模型,”佩雷斯說。
這一觀點引起了卡麗娜·阮(Karina Nguyen)的共鳴,她曾是 OpenAI 和 Anthropic 的研究員,目前正在建立自己的公司 Thoughtful。(我們在電話里取得了聯(lián)系,因為她當時正在簽公司第一個辦公空間的租賃合同。)據(jù)她估計,世界上大約只有 200 名精通后訓練方法的專家,由于他們都是工程師,他們優(yōu)化模型的思路是圍繞數(shù)學和工程思維展開的。
但阮設想,由同等權重的工程和設計專業(yè)知識作為支撐,Thoughtful 可以為其他公司對模型進行后訓練。這能將特定的 AI 敏感度帶入醫(yī)療或法律等領域,而這些敏感度在廣泛優(yōu)化的模型中往往會丟失。
許多 AI 體驗感覺千篇一律,是因為它們接入的 AI 都是一樣的。Krea 和 Thoughtful 正在考慮如何在不從頭開始構建前沿模型的情況下對其進行微調——這使他們能夠創(chuàng)造出比我們從前沿大模型公司那里得到的那些匆忙上線的功能更豐富的體驗。
“每個星期都有新事物發(fā)生,他們必須做出反應。因此沒有空間(去真正思考),”阮說。“你應該允許人們去想象,給他們離開去暢想的創(chuàng)意空間。我認為最具變革性的研究就是這樣產(chǎn)生的,設計也是如此。”
當我問佩雷斯,為什么我們沒有看到初創(chuàng)公司在 AI 的 UI 上進行更多實驗時,他的回答包含兩個層面。
首先,他指出工作流已經(jīng)為許多創(chuàng)意人士發(fā)生了改變——這呼應了我從 OpenAI 的費雪那里聽到的觀點。例如,他說,設計師現(xiàn)在可以拍攝一張產(chǎn)品照片并生成該照片的更多角度,甚至生成一張海報或一部電影。這里的 UI 并不新,但工作流是全新的。
其次,他表示,可能解鎖下一級別 AI 能力的新交互模態(tài)目前還無法實現(xiàn),因為 AI 的速度還不足以支撐它們。
“我們仍處于獲取能力的階段,”佩雷斯說,“在完成能力階段之后,才會進行性能優(yōu)化。”
Krea 一直在追求性能優(yōu)化。它是第一家實時生成風格化視頻的公司,但他表示,這在很大程度上只是一個概念驗證,因為人們更傾向于花時間等待以獲取好得多的輸出結果。給機器時間去渲染,它就能生成保真度更高的 AI 視頻。但 AI 漫長的渲染時間與流暢的工具體驗是不可調和的。
“你不可能用一個需要兩三分鐘才能生成的東西來構建界面,”佩雷斯直截了當?shù)卣f。但與 Black Forest Labs 合作訓練模型讓他們更進了一步。不可避免地,佩雷斯設想有一天,這些 AI 運行速度將提高 100 到 1000 倍。到了那時,我們將最終看到關于全新的一套多模態(tài)混合 GUI 工具如何運作的更大膽實驗。
在此之前,我們只有氛圍編程。
![]()
AI 就是瞬息全宇宙
在距離 Cursor 總部幾個街區(qū)外的北灘,我走上一段長長的樓梯,此時 Lu 正在暢談他對公司更宏大的愿景。他回憶道,當他生活在中國時,所有的代碼都是他自己寫的。
但當他來到硅谷時,他成為了一名真正意義上的“設計師”。突然之間,接觸代碼與他的工作完全脫節(jié)了。他在美國早期的一個項目尤其令人備受打擊,他眼睜睜地看著一個充滿愿景的項目在開發(fā)過程中逐漸枯萎。
Cursor 讓他完成了一個輪回,重新成為一名在本質上能夠寫代碼的設計師。在這個新時代,設計和開發(fā)不再是割裂的步驟。每一個概念幾乎都可以瞬間變成現(xiàn)實。這也在醞釀著人們對軟件的新期望。
“我認為 Figma(一款流行的設計軟件)在我只想在 2D 空間里把玩時仍然很有用。我想做我的畫板,我想確切地規(guī)定我的像素看起來究竟是什么樣子,”他說。“但在某個節(jié)點上,繼續(xù)做這些標記就沒意義了。因為你希望它在現(xiàn)實中跑起來,對吧?如果你……在 Cursor 里做原型……那就好像,我真的、真的很難再回到 Figma 了。”
正是這種理念驅動著他構建出一整套“瑞士軍刀”般的窗口。Cursor 正在進化成一個包含無限可能性的瀏覽器,而不是充滿按鈕和工具提示(tooltips)。它是無數(shù)塊白板,或是數(shù)字橡皮泥,等待著被你的下一個創(chuàng)作填滿。
真正的挑戰(zhàn)在于如何確保每一個窗口都能在用戶當前的水平上滿足他們,并帶領他們去向下一個目標。但這些窗口底層的引擎呢?在 AI 時代,無論哪家公司,那個引擎可能只是少數(shù)幾個共享的模型而已。
Lu 通過寶貝 Cursor 所展示的宏大愿景,實際上在很大程度上與 Anthropic 通過其不斷擴展的平臺和擴展程序所追求的目標是一致的——盡管他們是從完全相反的方向切入的。
開發(fā)者們正在意識到,AI 是一臺具有無限人體工程學特性的機器。它并不像有些人所說的那樣,通過生成式原生 UI 進行字面意義上的“變形”,但它正越來越多地擠進每一個可能的語境中。它可以成為任何特定用戶所需要的任何觸點。
這意味著 AI 將不會被一種新或舊的交互模態(tài)所定義——不是按鈕,不是智能體,不是語音,也不是工具提示。它將是所有的模態(tài),在所有的時刻,同時發(fā)生。它將不斷長出新的能力,不斷向新的需求彎折,并越來越受到作者型設計師的掌控。
但是,如果所有這些觸點最終都接入相同的 AI 后端,我確實會懷疑,一開始擁有那么多不同種類的軟件到底還有多長時間的意義。
“我的理論是,就像所有的軟件幾乎都是同一種東西。一些概念的包裝,然后數(shù)據(jù)在某處漂浮,互相傳遞,”Lu 說。“所以大融合幾乎是不可避免的。然后競爭就變成了,看誰能創(chuàng)造出最好的界面和最好的抽象,最簡單且能規(guī)模化擴展的那些。”
你可以幾乎想象這樣一個未來,有史以來第一次,每個人都在使用同一個應用程序,我告訴 Lu。在 iOS 和安卓(Android)生態(tài)里,我們已經(jīng)擁有了某種程度上的這個版本的未來。
“但你知道,舊的操作系統(tǒng)是建立在這種不再適用的應用程序模型之上的。也許我們需要打造一個操作系統(tǒng),”他說。
“Cursor 操作系統(tǒng)?”我問。
“是的,”Lu 說。“我不知道。這很簡單。現(xiàn)在,你只需要使用智能體蜂群(agent swarm),然后讓他們在上面工作大概一周就行了。”【懂】
歡迎加入經(jīng)叔的知識星球。在這里,我們拒絕無用的焦慮,只談底層的邏輯與實戰(zhàn)的干貨。我會結合最新的AI前沿動態(tài)、深度的商業(yè)創(chuàng)新分析(如一人企業(yè)的構建)和獨特的文化思潮(如麥克盧漢的媒介洞察),幫助大家把握時間窗口。
歡迎訂閱不懂經(jīng)知識星球,星球即將漲價。
我是不懂經(jīng)的經(jīng)叔,國內最早翻譯介紹了納瓦爾的《如何不靠運氣獲得財務自由》,以及影響了納瓦爾、中本聰、馬斯克等大佬的《主權個人》。
不懂經(jīng)知識星球,眾多百萬粉絲大V、千萬及億萬富翁訂閱。專注分享一人企業(yè)、一人創(chuàng)投主題,關鍵詞:AI、IP、創(chuàng)投、科技及商業(yè)前沿的高杠桿內容。
![]()
愈懂愈自由
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.