![]()
作者:蘇打
出品:明亮公司
經過多年數字化浸染后,企業端沉淀下來的大量數據,正等待進一步盤活和價值重塑。AI下場,另一種高效“解題思路”隨之出現,并為相關鏈條上的創業公司帶來巨大機遇。
在今年的中關村論壇年會上,楓清科技與中化信息、吉林大學宣布成立“人工智能賦能新材料聯合實驗室”。聯合實驗室將重點建設垂直領域推理大模型、開發新材料領域高質量數據集、構建智能工具平臺,并推進跨學科人才培養。楓清科技將利用自身平臺與大模型能力,助力材料研發全流程智能化,加速新材料的研發進程。
近日,「明亮公司」與楓清科技創始人兼CEO高雪峰就數據智能化的應用、楓清獨有的技術產品能力、圍繞鏈主企業全產業鏈開發的商業模式以及AI+新材料領域的前景等問題進行深度探討,以期呈現生長于AI高速推進環境中的創業公司如何把握機遇實現躍遷。
天眼查APP顯示,楓清科技(Fabarta)成立于2021年,定位“知識引擎與大模型雙輪驅動的新一代智能體平臺”,并希望通過新一代智能體平臺,幫助企業在復雜場景中實現精準、可解釋、安全的智能化升級和決策智能。
2022年與2023年,楓清科技分別完成數億元天使輪融資及Pre- A輪融資。其中天使輪由藍馳創投領投,將門創投、加盛巢生資本跟投;Pre- A輪融資中,由朗瑪峰創投領投,藍馳創投與將門創投作為老股東均超額追投。
以下為明亮公司與高雪峰的對話(有刪節)
Q:明亮公司
A:高雪峰 楓清科技創始人兼CEO
![]()
![]()
行業智能體核心是規劃,而不是變大參數
Q:能否整體介紹一下楓清的主要產品特質,以及伴隨行業對AI應用的熱情變高,近期是否有迭代以及新思考?
A:產品特色方面,首先,我們的知識引擎支持多模態數據,可以將企業海量的多模態數據轉化為大模型可以理解的知識;
其次,我們的知識引擎不僅能夠把數據、圖片或文本向量化,讓AI能夠讀取向量并作分析或內容生產,亦能將向量以及結構化數據之間的關系記憶和存儲下來。
第三,能夠實現智能數據編織。我們可以把企業積累的豐富數據,智能化編織到多模態知識引擎中——只要跟業務方把Schema(描述數據結構的模式)定義出來,剩下的事情就完全可以用AI完成,大量節省了數據標注等人工環節。
隨著客戶的體量越來越大,我們已經把很多企業級能力,比如安全、數據權限管控以及多租戶管理等能力,都疊加到了產品之中,真正形成了一個企業級的知識管理與智能體應用平臺。未來,伴隨AI的不斷發展,我們的產品體系也會跟隨技術發展趨勢以及客戶需求來進行更新。
Q:應用層面,你們在解決幻覺、可解釋性差、推理能力弱、數據安全這些痛點方面有哪些優勢,目前處于同行業中什么水平?
A:這些問題均為大模型以概率為核心的技術基底自帶的弊端,一個核心解決方法是把概率與符號邏輯推理技術進行深度融合。
因此,我們所有產品的出發點都圍繞著如何將符號邏輯推理能力融入到產品中。我們為此構建了支持圖、向量和文本等多模態數據存儲和記憶知識引擎。我們的知識引擎從底層幫助企業將本地數據進行結構化組織,使其既包含圖結構,又包含文本嵌入(embedding)的向量化數據。在此基礎上,我們再去進行各種AI能力的建設,便能從底層彌補上述這些問題。
比如,針對解釋性差和推理能力弱,我們可以把企業本地積累多年的數據和知識變成結構化的知識圖譜,疊加數據的向量化,通過模型體外精準推理的方式進行優化;幻覺方面,我們會將大模型生成的內容放入本地知識引擎中進行二次校驗,這樣就能及時糾正和調整不精準或者不符合本地數據與知識的問題并進行修正。
就行業智能體而言,最重要的是怎么做規劃和執行,其中的核心是規劃,這就要求它必須有一個懂這個行業的大腦,而不是單純地把模型參數變大。比如,在和一些企業進行HSE等領域合作中,如果我們自己的大模型都不懂本地安全操作的各種流程和規范,就無法識別不同工廠傳上來的視頻內容,更無法通過智能體編排調度去規劃每一步操作。所以,智能體的大腦一定要依托本地的知識沉淀和本地數據來微調。
數據安全是另一個story。很多企業的不同部門之間會進行數據安全隔離,但如果把這些數據全部扔給一個大模型去做微調,調完可能很容易把原數據勾出來。而對已經轉化到本地的多模態知識引擎中的知識,我們可以通過核心數據庫級別的數據權限管控能力,解決各部門對于原數據的訪問權問題。這就是為什么我們在解決實際行業問題時,必須要以數據為主中心,而不能沿用單純的model centric(模型為中心)的方式。
Q:楓清更擅長深耕哪些行業?目前積累的技術能力以及經驗是否可以實現跨行業復用?
A:基于以數據為中心的原則,企業或者行業的本地數據就非常重要。我們獲取數據大致有以下路徑,一是來自大行業,比如化工、農業、先進制造、半導體制造等。在一個大行業中,單獨一家科技公司是無法獲取全面行業數據的,所以我們選擇與行業鏈主企業一起合作,形成了許多技術與行業的聯合優勢。
另外有一些行業相對更通用,我們可以直接深入其中去做各種AI加場景化的賦能。比如跨境電商/跨境貿易,我們可以將其中一個環節150元左右的成本直接降至幾元錢,真正實現無人化。我們研發的新一代AI智能報關系統,結合多智能體協同處理技術,打造業了內首個真正具備“理解-執行-糾錯”能力的智能體產品。可以實現單證填報提速20 倍、核驗效率提升 10倍,并且支持7×24小時無間斷作業,旺季產能最高提升 300%。同時,系統還內置可 AI 風險哨兵,可實時比對港務與申報數據,自動生成修正方案,即使新人也能輕松應對復雜案例。獨創“任務找人”模式打破傳統流程,從報關指令、單證錄入、智能核驗到異常修正與申報暫存,構建全流程自動閉環,管理者僅需聚焦關鍵決策。
在大行業中,我們自研了智能體平臺,并已經與客戶一起找到很多高價值場景開始嘗試,比如與中國中化旗下中化信息一起,探索化工和農業的很多細分領域。近期,我們與一家著名通信領域鏈主企業將會啟動項目落地和簽約,另一家即將簽約的頭部半導體鏈主企業客戶,也將同我們一起推動AI能力的融合。
同時,我們也會繼續尋找更有價值的場景,比如化工新材料科研領域等。但整體而言,我們希望把行業智能體平臺以及多模態知識引擎,真正與行業場景與數據深度融合,所以目前并沒有規劃太多行業。
大行業層面,不同行業是無法直接進行跨行業落地的。但我們的核心產品,包括多模態知識引擎、知識智能構建,以及行業智能體平臺,包括圍繞知識引擎的大模型蒸餾技術等,都是跨行業通用的。這也是為什么我們既能服務化工和農業,也可以服務金融保險,還能服務先進制造業。我們還有“AI+跨境”的SaaS產品,基于既有的積累,只需兩三個月就能做出一個行業場景的智能化SaaS產品。
![]()
新材料潛力巨大,是各國「必爭之地」
Q:你們如何定義“高價值場景”?
A:首先是有價值,其次是實現的成本可控,這是兩個最核心的問題。
怎么評估有價值?我們有幾個標準,第一,相應的場景是不是能夠被頻繁地使用且具備粘性。很多公司做了一個DeepSeek一體機聊天機器人,但就讓大家沒事去聊聊天,一段時間后可能就沒人用了,這就不是一個高價值的場景。
其次,真正起到降本或是提效的目標。在我看來,提效就是降本,降本就是另一種方式的效率提升。比如之前提到的HSE領域,我們可以通過對不同工廠的多模態數據、實時視頻流以及已積累的企業安全操作規程數據,智能探測出哪些操作在對應的工廠里是有相應風險的,哪些高風險持續發生就有可能導致非常嚴重的爆炸等等。這個在以前可能會需要布置很多人進行24小時視頻監控,而且這些人要能讀懂相應的安全操作規程,然后一個一個進行核對確認。這種就是存在隱形降本的和提升效率需求的場景。
同時,我們也基于不同的行業做了結構化數據和多模態數據融合的企業智能數據分析。不同行業的企業都有自己的數倉指標,非常復雜,我們把企業能夠想到的數據全部扔到知識引擎當中去做關聯,就可以進行指標類數據的智能歸因分析,從而提升數據分析團隊的效率。
第三,高價值場景也是真正長期價值非常高的場景,比如新材料領域是各個國家必爭之地,未來能帶來的價值是非常巨大的。我們和中化信息,吉林大學聯合實驗室在做的AI+新材料項目,把AI跟傳統的仿真計算等進行深度融合,希望利用人工智能技術加速新材料等領域的研發進程。
但歸根結底,還是要評估場景中可實現的程度。如果有一種技術和一個場景,我們覺得價值都非常大,但需要兩三年非常重的投入才能實現一個簡單的原型驗證,這種我覺得也很難被稱為當下的高價值的場景。
Q:上述提及的新材料項目,目前有哪些新進展?你們對此有何預期?
A:新材料是我們在不斷研究和突破的一個領域,其潛在價值非常大,因為新材料是各個國家的必爭之地。這也是我們將其定義為高價值場景的主要原因之一。
4月份,我們聯合中化信息和吉林大學成立了AI+新材料的聯合實驗室,受到了北京市的高度重視,后續將結合本地沉淀的化工新材料領域數據實現化工領域行業模型。未來我們也會持續迭代這樣的一些模型。我們的團隊在這個領域里面都有相應的沉淀,預計七八月份就能推出很多成果,例如化工行業新材料合成模型,類似AI+仿真計算的產品也會隨后推出。
我們希望把這樣一個聯合實驗室做成更開放的生態。截至目前已經有很多化工材料公司找到我們,希望加入到實驗室。同時我們還希望能夠引入像礦物晶體等新材料,它們與化工類新材料的表征結構分子完全不同,但在AI融入產業的邏輯和理論上是類似的。
還有一個是生物制藥領域,也可以進行類似的AI+生物制藥探索。未來我們會演進成科學計算的聯合實驗室,把生物制藥、新材料等都納入進來,如此一來,實驗室沉淀的組件及技術等便可以實現跨行業互動。
Q:DeepSeek的出現對你們而言帶來哪些積極的影響?
A:首先是AI的平權化。以前大家想使用這種推理模型,基本上只能用云上的API或者是跟大模型廠商合作私有化部署,幾乎很難將其變成行業的推理模型,而且成本也非常高。
而DeepSeek可以讓每一個鏈主企業都擁有一個滿血版本的推理模型,開放的蒸餾技術可以讓我們把一個基模型的推理能力結合行業數據,在一個小參數的模型上,體現出非常優秀的既懂行業又懂推理的模型,同時也推動我們構建起自身完整的產品矩陣。
其次,DeepSeek出圈后,所有人都開始關注AI,并推動了其他大模型的不斷迭代,給當下整個AI生態注入了非常多的活力。這讓很多企業都意識到不接觸AI就會被行業所淘汰,并讓他們非常愿意投入和付費。
![]()
做大「AI+產業」,與鏈主企業站在一起
Q:在去年收入的基礎上,今年你們規劃的收入目標是否有調整?
A:去年是我們真正商業化的第一年,當年就實現了數千萬的訂單體量,大部分客戶都是去年底開始跟我們開展合作的。
隨著鏈主企業客戶越來越多,今年我們整體訂單量肯定會出現規模化的提升,我們預期今年的既定目標將會比去年翻一番。預計今年的總訂單數量肯定會超過既定目標。至于最終能夠實現多少的收入,主要取決于我們自己是否愿意在更多行業跟鏈主進行更深度的投入。
此外,我們希望同時起量AI SaaS的產品。預計全年大約有20%的收入來自跨境SaaS的產品服務,為我們明年構建起非常好的訂閱制收入基礎,而且現在只是早期階段,未來肯定會出現指數級的增長。只要產品是在市場上是受歡迎的,我們會配合KA客戶每年的預算進行投入,構建相應的收入基礎。
Q:商業化路徑上,我們選擇攻堅鏈主企業的邏輯是什么?
A:首先,人工智能作為新一代工業革命的關鍵技術,只有與行業場景深度融合,才能真正釋放高質量發展的新動能。行業場景know how的積累,行業核心的痛點,以及行業號召力和上下游產業鏈的數據積累,幾乎都掌握在鏈主企業手中,而這些又都是在AI+產業中非常重要的一部分。所以我們要做大AI+產業,深入這行業,與鏈主企業站在一起是行之有效的方式。
其次,我們的團隊核心成員具備IBM和阿里的融合背景,在to B領域里面有近20年的積累,深知如何做出一個標準化、具備企業級能力的產品,而不是單純做個應用。我們也一直在幫助客戶以超過他們想象的速度迭代其產品,所以鏈主企業與我們的合作都非常順利。
當下我們的綜合規模可能不如上市公司,但客戶愿意選擇我們進行更緊密的深入合作,這也能在一定程度上證明我們的團隊基因、產品的能力以及正在做的事,是能夠真正解決實際行業和產業痛點的。而且我們和一些大廠也都是非常好的戰略合作伙伴,市場定位上也是能夠補充并充分合作的。
Q:目前鏈主企業在收入中的占比怎樣?
A:去年大約有60%的收入來自鏈主企業,今年至少會占到70-80%。但明年,來自鏈主企業的收入占比可能會明顯下降,我們希望降至50%左右,因為鏈主以外的行業場景SaaS收入會逐漸起量。但這是軟件領域良性收入結構構件的一個表現。
簡單來講,我們定義的鏈主企業并非單獨一個企業,而是其背后涉及的長產業鏈條,比如中化有一個場景,日化品的材料生產、原配料等的規則標準,我們會結合多模態的知識引擎產生一些相應的智能化應用,與中化一起把這些應用銷售給全產業鏈的生產商。而且他們的出海業務也正好可以匹配我們的跨境SaaS服務能力,可以實現雙向賦能。
與單獨的企業相比,我們更希望在產業鏈上賺更多錢,所以不會拓展太快,也不會大量鋪不同的鏈主企業。因為一定要更深入下去才對得起之前的投入,回報也會更多。
![]()
高價值場景對應的收入,更具戰略價值
Q:目前研發投入占比怎樣?
A:海外很多高價值的科技公司研發投入都非常大。我們作為一個以AI+科技為核心的公司,大比例投入也會放在研發上,當下約為80%。
我覺得未來一段時間的研發投入也不會低于60%,甚至會更高,這也是該行業的一個特質。
比起收入規模與研發投入的比例關系,就是市研率,我更關注研發投入的增速要低于整體的營收增速,這是衡量運營財務數據指標時考慮的一個核心問題。
Q:在判斷營收來源時,哪些板塊的收入更具戰略價值?
A:整體而言,我們會重點關注跟鏈主企業合作,找到高價值場景,然后將標準化的產品推向整個行業,既要服務好鏈主企業,也要服務好大行業中的中小企業。所以只要符合這樣的潛在標準,這部分的營收就是高價值的。但如果我只是給客戶做了一個項目、解決了一個問題,但不能實現行業復制,即便能產生收入,也不符合高價值收入的邏輯。
Q:近幾年營收的增長處于什么水平?預計何時能實現盈虧平衡?
A:去年我們全年實現了數千萬的收入,每年營收增速超過200%,今年也會繼續保持這個速度,預計將會達到300%,我們對此非常樂觀。
以當下的研發投入和運營成本計算,我們希望能夠在明年實現業務層面的盈虧平衡。但是如果出現一些新機遇,比如我們希望在AI+新材料領域進行非常深入的研究,也可能會加大投入。
Q:融資和IPO方面,公司有哪些規劃和目標?
A:融資方面,盡管目前只是Pre- A階段,但我們仍舊希望在以業務為重心的前提下,有持續的資金注入。整體而言,我們會更加歡迎能夠實現資源協同的投資機構,包括區域性資源和產業資源。
IPO方面,我們的路徑會比較多樣,包括單獨上市、與其他上市公司進行深度合作等。相信時間應該不會太久,如果能實現盈虧平衡,業務模式得到驗證,我們將會很快推進IPO的相關事項。
![]()
在全球對標Palantir,在中國成為融合「IBM+微軟」優秀能力的科技型企業
Q:全球范圍內,楓清是否有對標的公司作為階段性目標?
A:在美國比較清晰,我們對標的是Palantir,希望能夠推動企業數據與AI的深度融合;在中國,我們更希望成為我們所在領域的“微軟”和“IBM”的結合體,只做“微軟”或者只做“IBM”都可能會水土不服。
一方面,微軟to B和to C的核心產品層面均有非常好的積累,產品力很強。另一方面,我曾在IBM工作十幾年,深知IBM在理解用戶需求和服務企業級客戶方面的經驗非常獨到。我們想成為一家結合IBM Consulting 經驗加上微軟優秀的產品基因的公司,來服務好我們本土的企業級客戶。
Q:當年選擇創業,是否因為看到行業中有一些尚未解決的問題,團隊希望躬身入局?目前是否已經階段性實現了目標?
A:IBM任職期間,我作為IBM 認知計算解決方案研究院負責人,做了很多前沿研究,也接觸到許多全球500強企業和非常多中國各行業的客戶。
我清楚地看到,中國的數字化進程非常快,大部分企業在數字化上面做了非常多投入。但到2021年左右,很多企業雖然都實現了數字化,沉淀下來的數據卻不知道用來干什么,最多用來做一些報表和展示,數據的價值密度非常低。那個時候我們就認為,未來數據智能化市場一定非常大,而且這個市場剛剛興起,只有鏈主企業在開始關注,這是我們決定創業的契機。
實際上,2021年左右,我們在阿里任職時,就已經開始使用生成式人工智能技術,那個時候這些AI能力只是我們在跟客戶談數智化升級過程中的一個體現。
所以決定創業后,我們看重的并非大模型市場,而是企業的智能化市場。大模型非常優秀也非常值得關注,但行業一定還需要其他技術一起,來完成和實現企業的數智化進程。在IBM時,我們有一個全球的項目叫Intelligent Workflow,就是如何把企業的工作流變得更智能化,這個也是當下我們正在專注的事情。
我相信路還很長,我們已經實現了一些階段性的勝利,但未來還要繼續努力與我們的企業客戶一起創造更多高價值場景,服務全產業鏈上的各種企業。
Q:業內一直有觀點認為,中國軟件業的商業化不太樂觀。你覺得AI加入后,是否能為行業帶來一些新機遇?
A:中國的數字化的進程在不同行業和企業中,發展非常不均衡,有些企業采用的是標準ERP軟件,有些企業則會通過各種方式自建。另一方面,工作流的種類和廠商層出不窮,標準極不統一,導致構建生態軟件時需要做非常多的定制化,涉及到很多API的對接、各種數據的梳理對接轉換等等。
面對中國標準化軟件的挑戰,AI+產業這波浪潮是真正可以顛覆原本整個軟件生態的規模和協同方式的,比如摒棄API,完全通過智能化的MCP協議完成對軟件數據和能力的操作。而且企業沉淀的數據也可以匯總到企業獨立的知識引擎中,實現知識的綜合運用。
未來將會是一個完全智能化交互的時代,中國的智能化市場也一定會涌現出非常多標準化的企業軟件,去改變原有的游戲規則。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.