無論是OpenClaw的爆火,還是“千問搶奶茶”,都在預(yù)示著AI行業(yè)正在向Agent不斷發(fā)展。隨著Agent的革命漸深,算力與性能突破成為最大的問題。
2026玄鐵生態(tài)大會,達摩院發(fā)布高性能RISC-V CPU玄鐵C950,為全球首款 SPECint2006 Base單核性能超70分的RISC-V處理器,為當(dāng)前全球性能最強RISC-V CPU。此外,同時推出兩大RISC-V原生AI引擎,促進高性能通用算力與AI算力融合。
這一產(chǎn)品背后有哪些細節(jié)值得關(guān)注,阿里達摩院對于當(dāng)下AI行業(yè)有何研判,RISC-V當(dāng)下發(fā)展究竟如何?負責(zé)人解答了EEWorld相關(guān)問題。
RISC-V向AI Agent發(fā)展,挑戰(zhàn)重重
“當(dāng)前RISC-V產(chǎn)業(yè)正在從‘星火燎原’到‘攻堅破局’。” 達摩院首席科學(xué)家孟建熠表示,RISC-V已歷經(jīng)十五年發(fā)展,走過了三個“五年計劃”:第一個五年完成了從學(xué)術(shù)研究到產(chǎn)業(yè)應(yīng)用的初步轉(zhuǎn)變,第二個五年大量IP標準相繼發(fā)布,第三個五年持續(xù)推進初步產(chǎn)業(yè)化。
展望未來五年,根據(jù)SHD專家的預(yù)測,到2031年,全球?qū)⒂?70億臺設(shè)備采用RISC-V架構(gòu),這些設(shè)備所創(chuàng)造的市場價值將達到3000億美元。這未來五年會是怎樣的一個年代?是從AI邁向Agentic AI的時代。
“在AI時代,我們曾探討如何利用RISC-V實現(xiàn)加速,而在Agentic AI時代,我們需要賦予AI更強大的能力。”孟建熠分析,當(dāng)前,諸多任務(wù)處理正重新回歸CPU,CPU架構(gòu)與GPU架構(gòu)正呈現(xiàn)出不斷融合的發(fā)展態(tài)勢。
這意味著,我們既需要更高算力的CPU、更大容量的內(nèi)存、更優(yōu)質(zhì)的I/O,也需要GPU在CPU的協(xié)同下實現(xiàn)更高效率。因此,從系統(tǒng)層面出發(fā),需要協(xié)同創(chuàng)新、開放共享且具備良好生態(tài)的架構(gòu),以支撐未來Agentic AI所帶來的全新格局。
RISC-V要在Agentic AI時代真正脫穎而出,還需打贏兩場關(guān)鍵戰(zhàn)役:第一,通用計算能力;第二,AI能力。
在通用計算的高性能領(lǐng)域,技術(shù)要求極為嚴苛。x86架構(gòu)以更高主頻為特點,單位性能相對較低,SPECint 2017評分約為2分以上;Arm架構(gòu)主頻略低,但單位性能相對更高, SPECint 2017評分需達到2.5分以上,方能真正躋身高性能計算領(lǐng)域。與此同時,AI帶來的挑戰(zhàn)同樣巨大,涵蓋技術(shù)、產(chǎn)品以及生態(tài)等多個層面,RISC-V所面臨的考驗不容小覷。
玄鐵交出的答案,C950和C925
在生態(tài)大會上,玄鐵面相AI Agent應(yīng)用發(fā)布了兩款產(chǎn)品——C950、C925。
首先是高性能旗艦產(chǎn)品C950,這是首款單核SPECint2006 Base評分超過70分的產(chǎn)品,也是當(dāng)前全球性能最優(yōu)的RISC-V CPU。這一成果得益于在微架構(gòu)與軟硬件協(xié)同創(chuàng)新方面的持續(xù)投入,產(chǎn)品開發(fā)周期歷時兩年。其微架構(gòu)采用8指令譯碼、16級流水線,亂序窗口超過1000條,在5nm工藝下主頻達到3.2GHz,單位性能達22/GHz,SPECint 2006 Base性能相較上一代玄鐵C920提升超過三倍。
玄鐵C950也是面向Agentic AI優(yōu)化的處理器。它支持RAV23.1標準,并集成了COVE安全功能。安全沙箱要求在低CAS場景下實現(xiàn)快速運行,其單位SPECint 2017達2.6/GHz,在電子標準院通用CPU Bench測試中達到0.8/GHz以上。面向AI應(yīng)用,其訪存帶寬能力相較上一代產(chǎn)品提升超過四倍。
在上述技術(shù)特性的加持下,C950與目前業(yè)界領(lǐng)先的CPU產(chǎn)品處于同一梯隊,并能夠進一步發(fā)揮RISC-V定制化優(yōu)勢,在特定場景下實現(xiàn)30%的性能提升。因此,這是一款兼具通用計算與定制化計算能力的產(chǎn)品。
![]()
![]()
在此基礎(chǔ)上,阿里達摩院還發(fā)布了一款針對去年發(fā)布的玄鐵C930提升能效的產(chǎn)品——玄鐵C925。C925同樣支持RAV23.1,SPECint 2006達12/GHz,能效相較C930提升11%,面積縮減34%。
![]()
至今,玄鐵在高端計算領(lǐng)域,坐擁了C950、C930、C925三款產(chǎn)品,三款產(chǎn)品分別對應(yīng)高性能、綜合平衡與極致能效三類定位:C950主要適用云計算,高性能AI計算等高性能計算場景;C930主要適用于服務(wù)器、具身智能,智能駕駛等高性能計算場景;C925主要適用于智能終端,工業(yè)控制,消費電子等領(lǐng)域。
![]()
兩款A(yù)I加速引擎,助力RISC-V原生支持跑大模型
對于RISC-V來說,加速器也至關(guān)重要。此次,阿里達摩院發(fā)布了RISC-V架構(gòu)上擴展的兩款A(yù)I加速引擎:Vector引擎與Matrix引擎。
相較傳統(tǒng)NPU,這兩款引擎的顯著差異在于與CPU實現(xiàn)統(tǒng)一尋址。統(tǒng)一尋址意味著在實際使用過程中無需進行內(nèi)存拷貝,從而大幅提升計算效率。
Vector引擎支持4096位寬向量,矩陣計算方面,單核最高可提供8Tops算力,并支持多種數(shù)據(jù)類型,包括FP8、FP4等15種新型數(shù)據(jù)類型。這充分體現(xiàn)了RISC-V作為后來者,在適配新標準方面的敏捷優(yōu)勢。
![]()
此外,兩款A(yù)I加速器引擎支持194種主流算子,涵蓋當(dāng)前大模型所需的全部21種算子。在不同矩陣規(guī)模、不同算法算子的數(shù)據(jù)類型下,均能保持高度一致性,實際算力可達理論算力的90%,這是一項十分難得且意義重大的成果。
在此基礎(chǔ)上,阿里達摩院將C950與Matrix、Vector引擎相結(jié)合,實現(xiàn)了單芯片運行千億大模型的能力。測試數(shù)據(jù)顯示,在千問30B模型上可達80 tokens/s,在千問235B模型上可達34 tokens/s,在DeepSeek 671B滿血版模型上可達18 tokens/s。這一推理表現(xiàn)堪稱卓越,也是RISC-V首次原生支持滿血大模型的成功案例。
![]()
針對可擴展性,推出平臺型產(chǎn)品Flex
“可擴展性是RISC-V的重要優(yōu)勢。過去一年,我們分析了35家客戶提出的38項改動,其中50%是客戶結(jié)合自身應(yīng)用場景進行的定制與優(yōu)化。”孟建熠表示,為此,今天同步推出面向RISC-V擴展的平臺型產(chǎn)品Flex,該平臺可為客戶提供從模型到擴展再到工具鏈的一整套體系。
以往的服務(wù)大多僅提供定制化指令,但在當(dāng)前優(yōu)化架構(gòu)下,僅靠指令已無法滿足需求,還需涵蓋存儲、新型編程模型等多方面支持。Flex正是為此而生,使用戶能夠在標準化玄鐵統(tǒng)一生態(tài)的基礎(chǔ)上,擴展出契合自身行業(yè)Know-how的新架構(gòu)。
以存儲與多媒體場景為例,通過定制化指令,相較標準化RVV(向量擴展指令)實現(xiàn)了超過4倍的性能提升,這些能力將在云計算場景中展現(xiàn)出更強的競爭力。針對上述兩項技術(shù),達摩院玄鐵與中興通訊持續(xù)合作,將這些擴展技術(shù)反向貢獻至基金會,推動其成為標準,有望未來為客戶帶來差異化價值。
軟件方面,也已就位
軟件對于AI Agent也至關(guān)重要。孟建熠表示,當(dāng)前RISC-V生態(tài)的關(guān)注點,已從移植Linux、安卓等操作系統(tǒng),轉(zhuǎn)向應(yīng)用適配與優(yōu)化階段。基礎(chǔ)軟件已基本完備,但應(yīng)用軟件才是真正服務(wù)終端用戶、支撐Agentic AI落地的關(guān)鍵所在。因此,阿里達摩院已正式進入應(yīng)用軟件優(yōu)化階段。
尤其是與中科院軟件所在如意社區(qū)的合作成果顯著。在RISC-V原生操作系統(tǒng)方面,雙方在Linux內(nèi)核、AI軟件棧以及Java等應(yīng)用優(yōu)化上共同發(fā)力,通過軟硬件協(xié)同,性能較原來提升20%,未來計劃再提升50%。值得一提的是,玄鐵已成為軟件所如意社區(qū)的最大貢獻者,在Patch方面的貢獻占比超過25%。
在產(chǎn)業(yè)生態(tài)方面,達摩院玄鐵聯(lián)合全球數(shù)十家伙伴研發(fā)適配RISC-V的AI軟件棧、FuSa編譯器、Trace工具、Flash編程工具、CPU和芯片建模工具,計算庫性能相對開源提升30%以上,推理性能相對開源版本提升40%。
此外,達摩院牽頭組建的“無劍聯(lián)盟”在海爾家電體系落地,為新的商業(yè)范式打樣。今年,今年,無劍聯(lián)盟又迎來國芯科技、Canonical、千問、天翼云、SGS等新成員,將在 SoC定制化服務(wù)、操作系統(tǒng)生態(tài)、AI模型與硬件結(jié)合、云計算應(yīng)用落地、測試認證等領(lǐng)域開展合作,推動RISC-V向下游場景滲透。
標準化之后,發(fā)揮可擴展性優(yōu)勢
提及RISC-V,很多人第一反應(yīng)都是生態(tài)碎片化問題。RISC-V作為新興架構(gòu),標準是其發(fā)展基石。然而,標準化是否意味著RISC-V的發(fā)展應(yīng)止步于此?孟建熠認為,RISC-V的上限應(yīng)在于充分發(fā)揮其可擴展性,通過可擴展能力面向具體場景打造差異化競爭力。因此,RISC-V架構(gòu)的生命力,恰恰在于如何實現(xiàn)標準化與定制化的辯證統(tǒng)一。
“我們從2019年起便開始在產(chǎn)品中應(yīng)用RISC-V,這幾年來,深切感受到RISC-V生態(tài)發(fā)展極為迅速。”全志科技產(chǎn)品研發(fā)中心總經(jīng)理黃少銳坦言,最初與阿里達摩院合作時,產(chǎn)品和軟件開發(fā)過程頗為艱難,RISC-V生態(tài)尚不成熟。
而如今,全志在大量產(chǎn)品中已將RISC-V用作主控,軟件生態(tài)已發(fā)生顯著變化。無論是內(nèi)核、中間件,還是上層配套及AI部署,都已趨于完善,基本達到了唾手可得的程度。企業(yè)在RISC-V基礎(chǔ)功能方面已做好充分準備,新產(chǎn)品開發(fā)所需的軟件也相對成熟。
從RISC-V終端應(yīng)用來看,黃少銳認為有兩個方向潛力巨大:一是在機器人等產(chǎn)品中,采用端側(cè)通用CPU搭配輕量級AI,未來RISC-V大有可為;二是雖然目前產(chǎn)品對通用算力的需求尚處于較低水平,但正在逐步提升。例如,隨著大模型應(yīng)用的部署,原先三核、四核的產(chǎn)品已難以滿足需求,四核、八核產(chǎn)品正成為新的主流。這類場景對通用算力的需求不斷增長,也將在未來成為RISC-V大規(guī)模落地的重要方向。
全志為什么選擇玄鐵?黃少銳表示,原因是玄鐵長期持續(xù)投入,軟件、工具鏈及生態(tài)完善,同時產(chǎn)品矩陣與全志產(chǎn)品線匹配。通過雙方的合作,全志獲得了可快速響應(yīng)的定制化需求,解決場景痛點,提升產(chǎn)品競爭力。
“過去南芯做的多是模擬類的單一電源管理芯片,而現(xiàn)在我們做的電源供電芯片非常復(fù)雜,如果沒有達摩院提供的開源生態(tài)內(nèi)核支持,我們很難完成這項工作,或者需要耗費很長時間,才能從純粹的電源公司轉(zhuǎn)型為具備數(shù)字化能力的復(fù)雜芯片設(shè)計公司。”南芯科技資源開發(fā)副總裁姜濤表示,與過去相比,如今無論是終端還是服務(wù)器,算力都在不斷提升,對電源管理的要求也越來越高。
南芯為什么選擇玄鐵,姜濤表示,RISC-V是彎道超車機會,達摩院投入大、是行業(yè)頭部企業(yè),而且兩家企業(yè)地理相近。通過雙方的合作,南芯拓展到了頭部客戶,出貨量提升,產(chǎn)品成本具競爭力,模塊化優(yōu)勢適配靈活需求。
不可否認的是,當(dāng)下RISC-V仍有發(fā)展空間。孟建熠表示,RISC-V發(fā)展的核心卡點是時間,從標準到 IP、芯片,再到規(guī)模化落地,周期較長,需更多年出貨近億顆RISC-V 芯片的企業(yè),積累足夠群眾基礎(chǔ)。
而把目光再放回現(xiàn)在,今年是推理大年,模型向Agentic AI演進,CPU架構(gòu)需重新設(shè)計。玄鐵C950正是為此時代而生的新型CPU。
來源:電子工程世界(EEWorld) 作者:付斌
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.