337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

460億的AI語音獨角獸,將“歸0”?

0
分享至


音頻AI領域的當紅炸子雞ElevenLabs完成了一輪由紅杉資本(Sequoia)和ICONIQ領投的融資,估值飆升至66億美元(約合人民幣462億元)。在短短九個月內,這個數字翻了一番。據悉,公司年度經常性收入(ARR)已突破2億美元,并在2025年底沖擊3億美元大關。

從《堡壘之夜》里的達斯·維達(Darth Vader)到不知疲倦的客服機器人,ElevenLabs的技術正無處不在。它正與OpenAI展開激烈巷戰,力圖成為人工智能時代的默認語音基礎設施。

然而,就在這個高光時刻,其聯合創始人兼CEO馬蒂·斯坦尼斯澤夫斯基(Mati Staniszewski)卻拋出了一個近乎“自殺式”的論斷。

馬蒂直言:“音頻模型將在未來幾年內商品化(Commoditized)。即便現在還有差異,但長期來看,這種技術壁壘會越來越低,甚至消失。”

所謂“商品化”,意味著核心技術將變得像自來水或電力一樣,雖然不可或缺,但極度廉價且隨處可得,不再具備溢價能力。

一家靠構建模型起家、估值數十億的獨角獸,為何宣稱自己的護城河即將枯竭?從違背極客審美的土味滑塊,到賠錢也要發的銷售傭金,這些看似離經叛道的決策背后,隱藏著怎樣的生存智慧?當技術紅利被抹平,ElevenLabs 究竟靠什么活下去?

今天這篇文章,希望對你有所啟發~

01

那個毀掉電影的波蘭男人

ElevenLabs的創業故事,始于波蘭的一間客廳。但在這之前,馬蒂和他的高中死黨皮奧特(Piotr)其實已經是一對“屢敗屢戰”的搭檔。

這對相識15年的好友并非那種一擊即中的天才。在很多個周末的黑客馬拉松里,他們曾試圖開發過“加密貨幣風險分析器”,也做過根據用戶情緒實時調整的“電影推薦算法”,但這些項目最終都無疾而終。

直到2021年底,當時,皮奧特正準備和女友看一部電影。因為女友不懂英語,他們打開了波蘭語配音版。

在那一刻,一種深受東歐文化熏陶的“痛苦”被重新喚醒了。在波蘭,無論電影里的角色是男是女、是老是少、是哭是笑,所有的配音通常都由同一個男人完成——一種被稱為“Lector”的單調畫外音。沒有情感,沒有起伏,所有的戲劇張力在那個平淡的聲音中灰飛煙滅。

“這是一個可怕的體驗,但它竟然持續到了今天,”馬蒂回憶道。

這種由于語言隔閡帶來的體驗降級,是英語世界的原住民難以感同身受的。在美國,人們理所當然地享受著豐富的情感表達和多樣的口音。但在非英語世界,聲音的魅力往往在翻譯中流失殆盡。

這種“局外人”的憤怒,成為了ElevenLabs的起點。馬蒂和皮奧特,一個在Palantir處理數據,一個在谷歌做工程,他們敏銳地意識到:Transformer和擴散模型(Diffusion Models)雖然在文本和圖像領域大放異彩,但在音頻領域卻是一片荒原。當時的音頻研究被邊緣化,缺乏關注。

他們決定做一個顛覆者:不僅要讓機器說話,更要讓它理解上下文的情感潛臺詞

“如果是一句‘多么美好的一天’,”馬蒂解釋道,“在書中正常的描寫里,它是愉悅的;但如果是主角倒霉時的自嘲,它就必須是充滿諷刺的。”

這種對“語境”和“情感”的極致追求,讓ElevenLabs的第一代模型就與當時市面上機械的TTS(文本轉語音)拉開了代差。他們沒有像傳統廠商那樣去硬編碼聲音的性別或年齡,而是讓模型自己去“解碼”聲音的特征。

正是這種源自波蘭的“切膚之痛”,注定了ElevenLabs從第一天起就不是一家為了技術而技術的公司,而是一家為了消除人類交流隔閡而生的產品公司。

02

垂直AI公司,

不被大廠碾壓的生存之道

在ChatGPT橫空出世后,一個陰影籠罩在所有垂直AI公司頭頂:在這個巨頭林立的斗獸場,當OpenAI、谷歌發布多模態模型時,你們會不會瞬間淪為被碾壓的“路邊尸體(Roadkill)”?

這是一個極其殘酷的問題。畢竟,OpenAI隨后發布的語音模式和谷歌的Veo系列都展示了驚人的統治力。馬蒂的回答揭示了ElevenLabs獨特的生存哲學:極度專注,管理上極度務實。“當每個人都在追逐通用大模型時,我們選擇在音頻這個被低估的領域深耕,”馬蒂在紅杉資本的播客中說道。

1. “三個月紅線”與土味滑塊

ElevenLabs內部曾發生過一場典型的“理想主義 vs 實用主義”的戰爭。

在早期,用戶強烈呼吁在產品界面加一個能調節語速的“滑塊”功能。但創始團隊和科研人員覺得這太“土”了,像是上一代老舊軟件的產物。他們堅持認為,真正的AI應該像人類一樣,根據文本的情緒自動決定語速的快慢(例如悲傷時慢,興奮時快),而不是靠人工調節。于是,科研團隊花了整整9個月試圖攻克這個難題。

結果并不理想,模型始終無法完美預測所有用戶的語速需求,用戶依然在抱怨。

最終,馬蒂定下了一條鐵律:如果科研部門在3個月內解決不了一個問題,那就讓產品部門用“笨辦法”解決。于是,那個“土味”的滑塊被加了上去,問題瞬間解決,用戶滿意度飆升。

“我們不能為了追求技術的完美而無視用戶的痛點,”馬蒂反思道。這種實用主義導向,讓ElevenLabs在迭代速度上始終壓過對手一頭。

2. 數據壁壘與分布式人才

除了產品策略,ElevenLabs在數據上也筑起了高墻。文本數據隨處可見,但高質量、帶有情感標注的音頻數據不僅稀缺,而且處理難度極大。

ElevenLabs不僅是在練模型,更是在構建數據工廠。他們雇傭配音教練,建立專門的標注團隊,去教AI理解什么是“悲傷中的顫抖”,什么是“憤怒后的壓抑”。這種對數據的“精耕細作”,是通用大模型廠商難以在細分領域復制的。

3、打破硅谷中心論,實行全員遠程辦公

馬蒂認為全球真正懂音頻AI的頂級研究員可能只有50到100人。為了捕獲這些稀缺的大腦,ElevenLabs打破了硅谷中心論,實行全員遠程辦公。

“如果你想雇傭最優秀的人,你就不能把自己鎖在舊金山的方圓十英里內。”這種分布式的架構,讓他們吸納了大量歐洲頂尖人才,這種國際化基因在處理多語言配音時,比美國本土團隊更具敏感度。

4. 賠錢也要發的銷售傭金

在商業化層面,馬蒂同樣展現出了驚人的戰略定力。

面對大廠拋來的橄欖枝,比如僅僅是把模型授權給對方做展示,ElevenLabs的銷售團隊往往能拿到豐厚的合同。但馬蒂意識到,這種缺乏深度的合作會把公司變成單純的“底層供應商”,甚至導致核心技術參數外泄,長期來看是戰略自殺。

因此,公司高層會經常“斃掉”這些短期利潤豐厚的單子。但為了不打擊銷售團隊的積極性,ElevenLabs制定了一個“反常識”的規定:即使一個銷售單子為了公司戰略被高層否決了,該銷售人員依然能拿到這筆單子的全額傭金。

這完全顛覆了“成單才有錢”的銷售鐵律。寧愿公司賠錢,也要引導團隊關注長期的戰略價值,而非眼前的現金流。正是這種極度清醒的頂層設計,讓ElevenLabs在巨頭的夾縫中守住了自己的生態位。

03

自下而上,

完成C端到B端的轉型

ElevenLabs的崛起路徑,是一條典型的“C端創作者包圍企業級”的路線。

在企業級銷售團隊尚未組建之前,ElevenLabs就通過一系列病毒式傳播事件引爆了網絡。

ElevenLabs非常擅長制造“梗”。

  • 第一個會笑的AI:在ElevenLabs之前,所有的TTS(文本轉語音)都是一本正經的“播音腔”。當ElevenLabs發布了第一個能發出逼真笑聲的模型時,互聯網沸騰了。大量用戶涌入平臺,只為測試AI怎么笑,這不僅帶來了流量,更確立了其“懂情感”的品牌心智。

  • 哈利·波特的時尚秀:隨后,那個讓《哈利·波特》角色穿上Balenciaga(巴黎世家)走秀的視頻席卷全網。那是ElevenLabs技術實力的第一次大規模路演。

  • 醉酒唱歌的意外:早期甚至有用戶試圖用僅支持朗讀的模型去生成歌曲(當時模型并不支持唱歌),結果生成出了像“醉漢唱歌”一樣的滑稽效果。這個Bug反而變成了一個梗,進一步助推了品牌的病毒式擴散。

緊接著,知名播主萊克斯·弗里德曼(Lex Fridman)采訪莫迪總理的視頻被AI翻譯成了流利的英語和印地語,讓全世界看到了跨語言交流的未來。

隨著用戶量的激增,ElevenLabs順勢推出了Voice Marketplace,允許用戶克隆并出租自己的聲音。這不僅是一個功能,更開啟了一種全新的資產流動模式。馬蒂透露,截至目前,ElevenLabs已經向共享聲音的創作者支付了超過1000萬美元的分成。

在這個市場上,發生過許多有趣的現象。比如有一個深沉的西班牙男聲,在西班牙本土反響平平。但當它被英語用戶發現并用來生成英語內容時,因為其獨特的拉丁磁性音色,瞬間成為了全球Top 3的爆款聲音。

這證明了聲音是一種可以跨越文化、被重新定義的抽象資產。ElevenLabs不僅在賣技術,更是在運營一個全球化的聲音交易所。

ElevenLabs“自下而上”的策略成功了。企業最初對AI語音持懷疑態度,但看到個人創作者利用該技術制造了大量病毒式傳播的內容,驗證了技術的質量和潛力。這些C端的熱度反過來教育了B端客戶,降低了企業的決策門檻。

ElevenLabs的客戶結構從2024年的90%個人開發者轉變為個人與企業五五開(50/50)。在短短一年多時間內,成功完成了向企業級市場(B端)的轉型。

在《堡壘之夜》(Fortnite)中,數百萬玩家第一次體驗到了與達斯·維達(Darth Vader)進行實時語音互動的震撼。這標志著ElevenLabs已經攻克了實時語音互動中最難的三個關卡:質量、延遲和穩定性。

為了服務好這些差異巨大的客戶,ElevenLabs重塑了組織架構。他們設立了“快慢雙軌制”:既有像微型初創公司一樣運作、需要在6個月內證明產品市場契合度(PMF)的創新小組,也有負責高可靠性、長期服務企業客戶的穩健團隊。

04

賣生態,做音頻屆的蘋果

回到文章開頭那個驚人的論斷——為什么馬蒂認為模型最終會變得“一文不值”?

因為他看透了科技發展的規律。長期來看,基礎模型的差異會縮小,純粹靠模型性能帶來的紅利會消失。為了不被時代的洪流淹沒,ElevenLabs必須進化。

馬蒂的策略是:做音頻屆的蘋果——上演“產品+AI”的魔法。他不僅賣模型,更賣工作流,賣應用,賣生態。

這個戰略認知的覺醒,源于早期的一個真實用戶故事。

在ElevenLabs剛發布那個只能輸入推特長度文本的小框時,馬蒂發現有一位有聲書作者竟然不僅沒有嫌棄,反而笨拙地將一整本書拆分成幾百段,進行了300次“復制-粘貼-下載-拼接”的操作,只為制作一本完整的有聲書。

“那一刻我們意識到,光有模型是不夠的,”馬蒂回憶道,“用戶需要的不僅僅是生成聲音,他們需要的是糾正發音、分配角色、編輯時間軸的一整套工作流。”

這次頓悟讓ElevenLabs徹底轉向。他們不再僅僅是一家模型公司,而是一個“創意AI代理平臺”。

1. 技術取舍:級聯(Cascading)與雙工(Duplex)的博弈

在從C端轉向企業級市場(如客服、醫療、教育)時,ElevenLabs面臨著一個艱難的技術抉擇。

目前的技術架構主要有兩種:

  • 級聯模型(Cascading):這是目前的行業主流。流程是:語音轉文字 -> LLM思考 -> 文字轉語音。優點是極其穩定、可控、不易犯錯;缺點是延遲高,且會丟失嘆息、停頓等非語言情感。

  • 原生雙工模型(Duplex):像GPT-4o的語音模式一樣,音頻進、音頻出。優點是極快、情感豐富;缺點是容易產生幻覺,不可控。

對于企業客戶(比如醫療公司Hippocratic)來說,護士機器人說錯藥名是絕對不可接受的。因此,馬蒂非常務實地選擇了在現階段主推“級聯模型”,盡管它聽起來沒那么酷。

“企業要的是不犯錯,而不是有感情,”馬蒂坦言。ElevenLabs正在研發下一代原生全能模型(Omni-model),試圖在2026年解決這個問題,但在當下,他們選擇了穩健。

2. 解決“下水道工程”

這種“做重”的策略也體現在了集成上。馬蒂指出,企業落地的最大痛點往往不是AI本身(RAG或大模型),而是如何接通老式的SIP Trunking(電話線路),如何連上Twilio,如何打通Salesforce。

通過解決這些傳統IT的“下水道工程”,ElevenLabs在企業核心業務流中扎下了根。如今,他們不僅服務于《堡壘之夜》,還與Chess.com合作,讓你在下棋時能聽到世界冠軍馬格努斯·卡爾森(Magnus Carlsen)的聲音在耳邊指導;與《時代》周刊合作,讓讀者可以直接“對話”年度人物文章。

這直接體現在了其客戶結構的復雜性上。以醫療公司Hippocratic為例,他們利用ElevenLabs的堆棧構建了完整的護士代理——自動給患者打電話、安排預約、甚至提醒用藥。這不僅僅是調用API,這是深度嵌入了企業的生命線。

05

聲音作為終極界面的未來

拿到66億估值后,ElevenLabs的野心宏大得近乎科幻:他想推倒語言的“巴別塔”,并讓AI通過聲音的圖靈測試。

首先是打破語言障礙。馬蒂設想在未來5到10年內,人們可以通過耳機或眼鏡,實現實時的、保留原聲特色的跨語言對話。“想象一下,你用中文說話,對方聽到的是地道的英語,但那依然是你的聲音。”

其次是“Omni-model”(全能模型)的構建。ElevenLabs正在研發一種端到端的原生音頻模型,直接理解音頻輸入并生成輸出。馬蒂自信地表示:“我們希望在2026年初,通過對話式AI的圖靈測試。”

但隨著能力的提升,責任也隨之而來。面對“AI生成內容將超過人類內容”的未來,以及深偽(Deepfake)詐騙的風險,ElevenLabs構建了一套“三層防御體系”:設備級身份驗證: 通過設備簽名確認電話是否來自本人,如同生物指紋;水印與白名單: 合法的AI代理必須帶有數字水印,表明身份;默認懷疑: 在上述兩層之外,系統應默認內容為AI生成。

這種務實的安全策略,比單純的呼吁監管更具建設性。

馬蒂描繪了一個由聲音驅動的未來。

在這個未來里,教育將被重塑。每個孩子都可以擁有一位蘇格拉底式的AI導師,它不僅博學,還能像理查德·費曼(Richard Feynman)那樣幽默風趣地講解物理——ElevenLabs已經拿到了費曼家人的授權,復活了這位物理頑童的聲音。

在這個未來里,技術將隱入幕后。我們不再需要低頭戳屏幕,而是回歸人類最原始、最高效的交流方式——對話。

2025盛景半年回顧


人生只有四千周,而企業生存期更短,跨越10年經營期的企業少之又少,企業要想有質量地活下去,活得更好更久,“極簡增長”就是看透并掌控事物本質的那個關鍵點。

選對了路,路就不會遠。盛景推出《極簡增長 立竿見影》在線課程,期望能夠幫助更多的企業走上增長道路。未來有多近,在于我們已經走了多遠。未來有多遠,在于我們與誰同行。期待與你同行、共勉。

歡迎大家點擊底部【閱讀原文】觀看《極簡增長 立竿見影》的在線視頻課程,了解如何用極致簡單的增長方法論,實現快速增長。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
韓國網友偷廣州街頭美景圖,配文:這就是首爾!瀏覽破百萬,照片中公交車尾清晰印有“廣州公交”4個字,發現“鬧大”后刪除博文

韓國網友偷廣州街頭美景圖,配文:這就是首爾!瀏覽破百萬,照片中公交車尾清晰印有“廣州公交”4個字,發現“鬧大”后刪除博文

大風新聞
2026-03-29 21:59:02
事關中朝關系,金正恩做出一個前所未有的表態

事關中朝關系,金正恩做出一個前所未有的表態

近史博覽
2026-03-30 09:48:04
張雪機車WSBK奪冠后咨詢量大增,直播間涌入6000多人,線下門店稱目前820RR暫未開放試駕,多款周邊限定商品已售罄

張雪機車WSBK奪冠后咨詢量大增,直播間涌入6000多人,線下門店稱目前820RR暫未開放試駕,多款周邊限定商品已售罄

極目新聞
2026-03-30 13:26:30
周杰倫新專輯封面被嘲 “老登味” 網友:現在是他個人的審美

周杰倫新專輯封面被嘲 “老登味” 網友:現在是他個人的審美

小蘿卜絲
2026-03-30 09:33:58
俄羅斯4人團隊做的VPN,成了中國用戶的救命稻草

俄羅斯4人團隊做的VPN,成了中國用戶的救命稻草

薛定諤的BUG
2026-03-28 11:13:03
想跑跑不了,特朗普失控

想跑跑不了,特朗普失控

南風窗
2026-03-30 15:11:57
單依純發長文致歉“錯誤全在我”, 李榮浩:不要賠償,早點休息

單依純發長文致歉“錯誤全在我”, 李榮浩:不要賠償,早點休息

韓小娛
2026-03-30 05:40:11
剛送別張雪峰,11歲女兒收到第一張江湖令!

剛送別張雪峰,11歲女兒收到第一張江湖令!

職場火鍋
2026-03-30 15:42:03
全網震動!字節跳動多人被抓!

全網震動!字節跳動多人被抓!

大佬灼見
2026-03-30 11:39:00
中國將在長江水下開高鐵

中國將在長江水下開高鐵

環球網資訊
2026-03-30 09:38:29
這倆人雖說是不違反法律吧,但是純膈應人啊

這倆人雖說是不違反法律吧,但是純膈應人啊

歲月有情1314
2026-03-30 14:37:46
英媒:美軍在伊朗村莊布設致命地雷

英媒:美軍在伊朗村莊布設致命地雷

參考消息
2026-03-30 14:27:05
米萊高調宣布:我將阿根廷的貧困率降低了27%,全靠尊重產權和市場經濟

米萊高調宣布:我將阿根廷的貧困率降低了27%,全靠尊重產權和市場經濟

風向觀察
2026-03-30 14:33:04
2500名美海軍陸戰隊抵近,德黑蘭為何威脅炸掉自己的“錢袋子”?

2500名美海軍陸戰隊抵近,德黑蘭為何威脅炸掉自己的“錢袋子”?

楓葉君評
2026-03-30 10:54:48
周杰倫: 鬼火少年老了

周杰倫: 鬼火少年老了

爆角追蹤
2026-03-29 21:26:58
一分錢不要,也得讓你長記性!業主車位被霸占10天,奧迪車大變臉

一分錢不要,也得讓你長記性!業主車位被霸占10天,奧迪車大變臉

火山詩話
2026-03-29 17:05:43
快訊!館長這是要起義了嗎?

快訊!館長這是要起義了嗎?

達文西看世界
2026-03-30 13:55:35
重慶一高校多名貧困生兼職送外賣被處分,最新進展:校方中止處分流程,未實際處罰

重慶一高校多名貧困生兼職送外賣被處分,最新進展:校方中止處分流程,未實際處罰

湖南法治報
2026-03-30 14:47:57
官方:CCTV5轉播U23國足vs越南U23的比賽

官方:CCTV5轉播U23國足vs越南U23的比賽

懂球帝
2026-03-30 15:20:05
邵佳一:正視與喀麥隆的差距;很感謝隊員們都在努力適應我的想法

邵佳一:正視與喀麥隆的差距;很感謝隊員們都在努力適應我的想法

懂球帝
2026-03-30 14:38:26
2026-03-30 18:51:00
盛景產業互聯網觀察 incentive-icons
盛景產業互聯網觀察
閱讀最精粹的商業信息。
2075文章數 5373關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

張雪機車奪冠公司估值超10億 創始人20年前紀錄片刷屏

頭條要聞

張雪機車奪冠公司估值超10億 創始人20年前紀錄片刷屏

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

游戲
藝術
本地
數碼
公開課

PS5Pro官宣漲價反而賣爆了?大量玩家搶著升級

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

本地新聞

用Color Walk的方式解鎖城市春日

數碼要聞

榮耀MagicBook 14/16筆記本開啟預約:Pro性能釋放高達80W

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版