337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

萬字長文,非常詳細!CPU架構變革:從Intel?4004 到現代系統級芯片

0
分享至


中央處理器(CPU)是所有計算設備的核心,從手機、筆記本電腦到服務器和游戲機均是如此。過去50多年來,在對性能、能效和新型計算范式的不懈追求下,中央處理器架構發生了翻天覆地的變革。本文聚焦中央處理器在架構層面的發展歷程,從全球首款商用中央處理器——英特爾4004說起,歷經20世紀后期的創新成果(如x86架構)、精簡指令集計算設計(如高級精簡指令集機器)的并行崛起,最終介紹如今英特爾、AMD和蘋果等企業推出的異構多芯片系統級芯片。

一、中央處理器的本質是什么?

中央處理器(也被稱為微處理器,或簡稱為處理器)是計算機中執行軟件指令的核心部件。從最基礎的層面來看,中央處理器會先獲取指令,解碼指令的執行要求,執行相應操作(如算術運算或內存訪問),最后將運算結果回寫。這是中央處理器的基本工作流程。


英特爾4004處理器(圖為C4004型號)是全球首款商用中央處理器。來源:維基百科

從物理層面來看,中央處理器并非什么神奇的裝置,它是一種集成電路,由數十億個被稱為晶體管的微型開關組成,這些晶體管通常以金屬-氧化物-半導體場效應晶體管的形式制作在單塊硅片上。晶體管的制造依托于以光刻技術為核心的高精度工藝:先在硅片表面涂覆感光材料,再通過帶有圖案的掩模對其進行紫外線照射。每次照射都會刻畫出微觀的電路圖案,經過蝕刻、摻雜和層疊等工序,形成晶體管結構以及它們之間復雜的布線。制造商通過重復數十次甚至上百次這樣的步驟,能在一枚指甲蓋大小的芯片(也稱為裸片)中集成海量晶體管——這一技術成就推動了過去幾十年中央處理器性能的飛躍式提升。


光刻機(由荷蘭ASML公司制造)是一款極為復雜且造價高昂的工程奇跡。

二、中央處理器架構詳解

現代中央處理器并非一個“包攬所有工作的單一部件”,而是由多個專業組件高度整合而成的集合,這些組件協同工作,以盡可能快的速度處理和執行指令。從基礎層面來看,可將中央處理器分為前端處理單元、一系列存儲單元和負責實際運算的多個執行單元。

(一)前端處理單元:取指與解碼

在進行任何計算之前,中央處理器必須從主內存/隨機存取存儲器中獲取指令(這些指令此前已從非易失性存儲設備中讀取),并理解指令含義,這一工作由前端處理單元負責:

1.指令取指器:從內存中獲取下一條待執行的指令(通常通過緩存獲取)。

2.指令解碼器:將指令的原始二進制位轉換為內部信號,向中央處理器其他部件下達后續操作指令。

3.控制單元:如同中央處理器的指揮中心,協調取指-解碼-執行的循環流程,并根據解碼后的指令在各單元之間傳輸數據。在現代中央處理器設計中,控制單元還會指導分支預測和推測執行操作,確保指令流水線始終處于工作狀態。以上步驟均屬于各類中央處理器中常見的傳統取指-解碼-執行循環。

(二)寄存器:中央處理器的高速暫存器

每個中央處理器核心的核心部位都配有一組寄存器,這是由靜態隨機存取存儲器構成的超小型、超高速存儲單元,用于存放處理器當前正在處理的數據和指令。寄存器的訪問速度比主內存甚至中央處理器自身的緩存快數個數量級,這也是中央處理器在計算過程中大量使用寄存器的原因。常見的寄存器類型包括:

1.通用寄存器:存放算術和邏輯運算的操作數。

2.專用寄存器:如程序計數器(用于跟蹤下一條待取指的指令)和指令寄存器(用于存放當前正在解碼的指令)。

(三)算術邏輯單元:整數運算與邏輯運算

算術邏輯單元是大多數基礎計算的執行場所:

1.處理整數算術運算(加法、減法、位移等)和邏輯運算(與/或/異或)。

2.當程序執行“將兩個數字相加”等指令時,算術邏輯單元就是執行該運算的邏輯電路。

3.在超標量和亂序執行設計中,中央處理器可能配備多個算術邏輯單元,以便在每個時鐘周期內并行執行更多操作。

(四)浮點運算單元:實數運算

對于涉及實數(小數)的運算,中央處理器會使用浮點運算單元:

1.浮點運算單元是專為浮點算術運算優化的專用執行單元,可處理加法、乘法、除法甚至平方根運算。

2.在早期的中央處理器中,浮點運算單元有時是獨立的協處理器,但在如今幾乎所有的現代芯片中,浮點運算單元都被直接集成到每個核心中,以提升性能。

(五)加載/存儲單元:數據傳輸

對于涉及各處理器模塊間數據傳輸的操作,會使用加載/存儲單元:

1.執行內存訪問操作,將數據從內存加載到寄存器(加載操作),或將寄存器中的值回寫到內存(存儲操作)。

2.通常配備加載/存儲隊列和緩沖機制,用于跟蹤內存操作并維持正確的執行順序,在亂序執行的中央處理器中尤為重要。

(六)地址生成單元:內存地址計算

對于涉及內存地址的操作,中央處理器會使用地址生成單元:

1.計算加載和存儲操作所需的內存地址,確定數據在內存中的讀取和寫入位置。

2.現代中央處理器通常配備多個地址生成單元,可同時計算多個內存地址,實現每個時鐘周期內的多次內存訪問,提升整體吞吐量。

(七)向量與單指令多數據單元

許多當代中央處理器還集成了單指令多數據或向量單元,可對多個數據元素同時執行相同操作,從而為多媒體、加密和人工智能工作負載帶來大幅性能提升。典型例子包括英特爾的流式單指令多數據擴展/高級向量擴展和高級精簡指令集機器的高級SIMD擴展。

(八)緩存與內存接口

雖然緩存內存并非核心執行引擎的嚴格組成部分,但它對性能至關重要:

1.一級/二級/三級緩存位于中央處理器和主內存之間,存儲近期使用的數據副本,以減少代價高昂(主要體現在延遲方面)的內存訪問。

2.現代中央處理器會將大量芯片面積用于這些緩存,因為為執行單元快速提供數據是實現高性能的關鍵。

(九)各組件協同工作

在流水線或超標量中央處理器中,所有組件必須協調一致地工作:

1.前端處理單元完成指令的取指與解碼。

2.讀取寄存器值并將其分派至相應的執行單元(算術邏輯單元、浮點運算單元、向量單元)。

3.執行單元完成運算,并將結果回寫到寄存器或主內存。

4.緩存和內存控制器在每個步驟中減少數據訪問延遲。

這些組件共同構成了數據通路和控制通路,讓現代中央處理器能夠每秒處理數十億條指令。

此外,中央處理器還具有指令集架構的特征,這是一種抽象接口,決定了中央處理器的可編程接口(指令、數據類型、寄存器等),即軟件在最基礎層面與中央處理器的交互方式。


馮·諾依曼架構由約翰·馮·諾依曼于1945年提出,至今仍是絕大多數現代中央處理器的架構基礎。

三、x86架構的誕生:英特爾8086

現代桌面中央處理器的發展歷程始于1978年,英特爾推出了8086微處理器(也被稱為英特爾架構86),這款芯片奠定了至今仍占據主導地位的x86指令集架構的基礎。當時,大多數消費級微處理器仍為8位設計,如英特爾自身的8080和齊洛格的Z80。8086處理器實現了重大突破,首次采用16位架構,即其寄存器、算術邏輯單元和內部數據通路均可同時處理16位字長的數據。


一款罕見的英特爾8086處理器型號(C8086)。來源:維基百科

在架構設計上,8086配備16位內部寄存器和16位數據總線,同時集成了20位地址總線,使處理器的最大尋址空間達到1兆字節,這在20世紀70年代末是一個極為龐大的容量。由于內部寄存器的位寬僅為16位,英特爾推出了獨特的分段內存模型來生成20位地址。內存地址通過“段地址:偏移地址”的方式計算:將16位段寄存器的值左移4位,再與16位偏移值相加,得到最終的物理地址。這套略顯繁瑣的系統在x86架構中沿用了數十年。

另一項值得關注的設計選擇是將處理器劃分為兩個主要內部模塊:總線接口單元和執行單元。總線接口單元負責與內存和輸入輸出設備通信、取指以及管理地址生成;執行單元則利用處理器的寄存器和算術邏輯單元完成指令的解碼與執行。為提升效率,總線接口單元配備了6字節的指令預取隊列,使中央處理器能在執行當前指令的同時獲取后續指令——這是指令流水線技術的早期形式。

寄存器組的設計也經過了精心考量。該處理器配備四個通用寄存器(累加器、基址寄存器、計數寄存器和數據寄存器),每個寄存器既可作為完整的16位寄存器訪問,也可拆分為兩個8位的半寄存器。同時還配備了指針和變址寄存器(如棧指針、基址指針、源變址寄存器和目的變址寄存器),以及四個用于內存段尋址的段寄存器。

在物理層面,該芯片采用40引腳雙列直插式封裝,包含約29000個晶體管,基于英特爾的高性能金屬氧化物半導體工藝制造。以現代標準來看,其晶體管數量雖不算多,但8086為計算史上最具生命力的架構之一奠定了基礎。

僅一年后,英特爾推出了8088處理器,作為8086的近親變體,它保留了相同的16位內部架構,但采用8位外部數據總線,降低了與現有硬件集成的成本。1981年,這款處理器最終被選用于初代IBM個人電腦,奠定了x86架構在個人計算革命中的核心地位。

四、x86架構的早期發展:從80286到80486

繼8086和8088取得成功后,英特爾在20世紀80年代持續優化x86架構。每一代新產品都帶來了重要改進,擴大了內存容量,支持更先進的操作系統,并逐步提升了性能。

(一)英特爾80286:保護模式問世

1982年推出的英特爾80286處理器在保持與8086兼容軟件向后兼容的同時,拓展了初代x86設計的功能。其內部仍為16位處理器,但24位地址總線使其尋址空間提升至16兆字節,較早期芯片的1兆字節限制實現了大幅突破。


英特爾A80286處理器(A80286-8型號)。來源:維基百科

該處理器最重要的新增功能是保護模式,引入了用于內存保護和多任務處理的硬件機制。在保護模式下,內存段通過描述符表進行定義,使處理器能夠強制執行訪問權限,實現程序之間的隔離。

這些功能使80286成為邁向現代操作系統的關鍵一步,不過出于兼容性考慮,早期的個人電腦軟件(尤其是微軟磁盤操作系統)仍在原始的實模式下運行。

(二)英特爾80386:32位架構轉型

英特爾的下一次重大飛躍來自1985年推出的80386處理器。這款處理器首次采用完整的32位架構,拓展了寄存器和內部數據通路,同時將最大可尋址內存容量提升至4千兆字節。


英特爾80386處理器(80386DX-16型號)。來源:維基百科

80386還通過內存分頁技術拓展了保護模式,借助內存管理單元和轉換旁視緩沖區等專用硬件單元,實現了真正的虛擬內存系統。操作系統可動態地將虛擬地址映射到物理內存,使程序能在獨立的地址空間中運行,不僅實現了先進的多任務處理環境,還大幅提升了安全性。

這些特性使80386成為首款真正能夠支持視窗新科技和早期類UNIX系統等現代操作系統的x86處理器。

(三)英特爾80486:組件集成與流水線技術

1989年推出的英特爾80486處理器保留了80386的32位架構,但通過多項架構改進顯著提升了性能。


英特爾80486處理器裸片照片(486DX2型號)。來源:維基百科

其中一項重大變革是將此前的外部組件直接集成到中央處理器裸片上。曾經作為獨立協處理器的浮點運算單元如今被內置到處理器中,大幅加速了浮點運算密集型的數學工作負載。

80486還首次引入了8千字節的片上一級緩存和流水線執行架構,使多條指令的執行過程能夠重疊,顯著提升了指令吞吐量。

憑借這些改進,80486的性能較80386實現了質的飛躍,同時保持了與早期x86軟件的完全兼容,為下一個重要的架構里程碑——奔騰處理器鋪平了道路。

五、奔騰時代:并行性、預測技術與智能執行

到20世紀90年代初,中央處理器設計師開始遇到單純提升時鐘頻率的瓶頸。為持續提升性能,架構設計師將重點越來越多地放在挖掘指令級并行性上,使處理器內部能夠同時執行多條指令。英特爾的奔騰系列成為這一探索過程中的重要轉折點,引入了多項架構創新,奠定了現代中央處理器設計的基礎。

(一)初代奔騰:超標量執行與分支預測

1993年推出的初代奔騰處理器較80486實現了重大突破。早期處理器大多一次僅能執行一條指令,而奔騰處理器首次采用超標量架構,在合適的條件下可在每個時鐘周期內發射多條指令。該芯片配備兩個并行的整數流水線(通常稱為U流水線和V流水線),使特定的指令對能夠同時執行。


初代奔騰處理器微架構示意圖。來源:維基百科

另一項核心創新是動態分支預測技術,這項技術旨在減少條件跳轉帶來的性能損失。現代程序包含大量分支指令(循環、條件語句和函數調用),中央處理器必須不斷判斷下一條待執行的指令。分支預測技術使處理器能夠預測分支的可能結果,并提前獲取后續指令,保持流水線滿負荷運行,提升整體吞吐量。

超標量執行和分支預測技術的結合,在無需大幅提升時鐘頻率的情況下顯著改善了處理器性能。

(二)奔騰Pro:亂序執行與寄存器重命名

1995年推出的奔騰Pro處理器實現了真正的架構飛躍,引入了英特爾的P6微架構。初代奔騰處理器雖能并行執行多條指令,但奔騰Pro更進一步,實現了亂序執行,使處理器能夠根據數據的可用性動態重新排列指令執行順序,而非嚴格遵循程序的原始順序。


奔騰Pro處理器微架構框圖。來源:維基百科

在實際應用中,這意味著中央處理器可以跳過等待數據(例如從主內存獲取數據)的指令,優先執行其他相互獨立的指令。這種方式能讓處理器的執行單元始終保持工作狀態,顯著提升指令執行吞吐量。

為實現亂序執行,奔騰Pro采用了寄存器重命名技術。x86架構向軟件暴露的寄存器數量相對較少,當多條指令試圖使用同一個寄存器時,會產生人為的數據依賴。寄存器重命名技術通過將這些架構寄存器映射到更大的內部物理寄存器池,消除了虛假的數據依賴,使更多指令能夠并行執行。

在內部設計上,奔騰Pro還會在執行前將復雜的x86指令轉換為更簡單的微操作,使其內部執行引擎的工作方式更接近精簡指令集計算處理器,同時仍保持與x86指令集的兼容性。

(三)動態執行技術與現代中央處理器的基礎

這些創新技術——超標量流水線、分支預測、亂序執行、寄存器重命名和推測執行——共同構成了英特爾所稱的動態執行技術的基礎。該技術的核心目標是在運行時識別相互獨立的指令,并通過多個執行單元以最高效的方式執行這些指令。

奔騰Pro及其后續產品(奔騰II和奔騰III)進一步優化了這些技術,引入了更大容量的緩存和多媒體擴展指令集、流式單指令多數據擴展等新的單指令多數據指令集,以加速多媒體工作負載。到20世紀90年代末,這些架構理念不僅成為高性能x86處理器的標準設計藍圖,還被整個計算行業廣泛采用。

六、GHz競賽與奔騰4:時鐘頻率至上的時代

到20世紀90年代末和21世紀初,中央處理器性能的市場宣傳開始聚焦于一個單一指標:時鐘頻率。更高的兆赫(最終發展為GHz)成為廣告宣傳和消費者認知中比較處理器性能的主要標準。英特爾在2000年推出的奔騰4處理器中大力踐行這一趨勢,該處理器基于全新的NetBurst微架構打造。


英特爾奔騰一顆Intel Pentium 4“Willamette”CPU,安裝在423插槽主板上

NetBurst架構的設計初衷只有一個:實現極高的時鐘頻率。為達成這一目標,英特爾將中央處理器的執行流水線大幅延長至約20級(后續版本甚至更長),使處理器能夠達到遠高于前代設計的頻率。

從理論上講,該架構的時鐘頻率有望擴展至10千兆赫。

然而,這一設計策略付出了巨大的代價。更長的流水線降低了每個時鐘周期完成的工作量(即每時鐘周期指令數),并使處理器對分支預測錯誤變得極為敏感——一旦出現預測錯誤,整個流水線都需要清空并重新啟動。

因此,早期的奔騰4芯片在實際工作負載中往往難以超越前代設計的性能,而AMD的競爭產品速龍處理器盡管時鐘頻率顯著更低、功耗更小,卻常常能提供更出色的性能。

奔騰4時代最終暴露了愛好者們后來所稱的“千兆赫誤區”:僅靠時鐘頻率并不能可靠地反映中央處理器的性能。能效、流水線深度、緩存設計和微架構改進都發揮著同等重要的作用。

最終,NetBurst架構因功耗和散熱問題觸碰到發展瓶頸,迫使英特爾在21世紀中期放棄該架構,并重新思考其整體的中央處理器設計策略。

七、安騰實驗:英特爾取代x86架構的嘗試

在桌面市場主推奔騰4處理器的同時,英特爾還在推進一項更為激進的項目:安騰處理器。這是一款與惠普聯合開發的全新64位處理器架構。

2001年推出的安騰處理器采用了顯式并行指令計算的設計理念。與依賴復雜硬件動態調度指令不同,顯式并行指令計算架構要求編譯器在程序運行前分析程序并確定可并行執行的指令。

從理論上講,這種方式能夠通過更簡單的硬件實現極高的指令級并行性。但在實際應用中,這對編譯器提出了極高的要求。從實際軟件中挖掘大量的并行性被證明是極為困難的,許多程序無法充分利用處理器的執行資源。


英特爾安騰處理器。來源:維基百科

該架構還面臨軟件兼容性的難題。由于安騰處理器與現有的x86應用程序不具備原生兼容性,運行傳統軟件往往需要通過低速的仿真方式實現。

2003年,AMD推出了x86-64架構,成為壓垮安騰的最后一根稻草。AMD并未徹底取代x86架構,而是對現有架構進行擴展,使其支持64位計算,同時保持與32位軟件的完全向后兼容。這種方式使操作系統和應用程序能夠向64位計算過渡,而無需拋棄龐大的現有x86軟件生態系統。

行業迅速向AMD的設計靠攏,英特爾最終也在其處理器中采用了相同的方案。盡管安騰處理器在小眾的企業服務器領域仍存在了多年,但其取代x86架構的最初目標始終未能實現。


AMD速龍64處理器(3200+型號),全球首款64位消費級中央處理器。來源:維基百科

八、多核與多線程技術的興起

到21世紀初,中央處理器設計師遭遇了功耗墻:進一步提升時鐘頻率會導致功耗和散熱失控。芯片制造商不再追求更高的頻率,而是通過提升并行性(即每個時鐘周期內可處理和執行的指令數)來改善性能。

解決方案就是多核處理器。中央處理器不再采用單一的大核心設計,而是在同一塊芯片上集成多個獨立的核心,每個核心都能執行各自的指令流。這使得軟件能夠將工作負載分配到多個核心上,顯著提升并行工作負載下的性能。

(一)多核中央處理器的崛起

行業轉型始于21世紀中期,AMD等企業在2005年推出了速龍64 X2等早期雙核處理器。多核技術迅速成為新的行業標準,中央處理器的核心數很快擴展至四核、八核,如今的桌面和服務器處理器甚至達到數十核。

這種設計方式使性能能夠實現可擴展提升,而無需大幅增加時鐘頻率和功耗。


AMD速龍64 X2系列,全球首款消費級多核(雙核)處理器。來源:維基百科

(二)同步多線程技術

除了增加核心數量,中央處理器設計師還在探索更充分利用每個核心內部硬件資源的方法。同步多線程技術是其中一項重要成果,該技術允許單個核心同時執行來自多個線程的指令。

2002年,英特爾在奔騰4處理器中推出了其同步多線程技術的實現版本——超線程技術。通過超線程技術,每個物理核心在操作系統中表現為兩個邏輯處理器,當一個線程因等待數據而停滯時,中央處理器能夠讓其執行單元繼續工作。


英特爾奔騰4(Northwood)處理器,首款支持超線程技術的消費級中央處理器。來源:維基百科

(三)并行性成為新的性能增長點

多核架構與硬件多線程技術的結合,使中央處理器設計向線程級并行性轉變。現代處理器不再單純依賴更快的時鐘頻率,而是通過同時執行大量線程來提升性能,不過這僅適用于能夠擴展至大量核心和線程的工作負載。

這一轉型從根本上重塑了中央處理器設計和軟件開發領域,操作系統和應用程序越來越需要針對并行工作負載進行優化。

九、精簡指令集計算與復雜指令集計算:兩條道路,一個終點

在20世紀80年代和90年代,中央處理器設計師圍繞兩種相互競爭的設計理念展開爭論:復雜指令集計算和精簡指令集計算。以x86為代表的復雜指令集計算架構注重開發能夠在單個指令中完成多項操作的復雜指令,而精簡指令集計算設計則推崇為快速執行和高效流水線優化的簡單指令。

(一)復雜指令集計算的根基:x86架構

x86架構被經典地歸為復雜指令集計算架構,具有可變長度的指令和復雜的尋址方式,旨在通過單條指令完成更多操作。盡管這種設計看似“臃腫”,但帶來了強大的向后兼容性,這是確保數十年軟件連續性和個人電腦行業發展勢頭的關鍵因素。

盡管存在這種復雜性,現代x86中央處理器會在內部將復雜指令轉換為更簡單的微操作,為類精簡指令集計算的執行流水線提供輸入。最終形成了一種混合設計,既保留了兼容性,又在內部充分利用了精簡指令集計算的高效性。

(二)IBM POWER架構與精簡指令集計算的崛起

最具影響力的精簡指令集計算研究成果之一來自IBM,其研究成果催生了POWER微架構,并于1990年首次應用于RS/6000工作站。這些處理器強調精簡的指令、大容量的寄存器文件和激進的流水線技術,以實現高性能。

POWER架構后來演變為強性能精簡指令集計算機架構,21世紀初為蘋果麥金塔電腦和多款主流游戲機提供算力支持。


IBM強性能精簡指令集計算機處理器。來源:維基百科

(三)Cell處理器:一次大膽的嘗試

IBM精簡指令集計算體系的一個特殊衍生產品是Cell寬帶引擎處理器,由IBM與索尼、東芝聯合開發。該芯片將傳統的POWER核心與多個專用向量處理單元(稱為協同處理單元)相結合,專為高度并行的向量/單指令多數據工作負載設計。

Cell微架構展現出出色的浮點運算性能,為索尼PlayStation 3游戲機甚至部分早期千萬億次超級計算機提供算力,但其復雜性導致開發人員難以充分利用其性能。


Cell處理器架構示意圖。來源:維基百科

(四)隨時間趨于融合

盡管精簡指令集計算與復雜指令集計算的爭論異常激烈,但現代中央處理器正日益模糊兩者之間的界限。如今的x86處理器通常會將復雜指令轉換為更簡單的內部微操作,這意味著其內部工作方式與精簡指令集計算處理器極為相似。

在實際應用中,現代處理器的性能不再過多依賴于指令集本身,而是更多取決于微架構創新,如強大的亂序執行引擎、寬指令解碼器、精準的分支預測器、大容量/高速緩存,以及在大量寄存器和寬數據通路上工作的多個執行單元。

十、現代創新:小芯片、向量擴展、人工智能及未來發展

隨著傳統的晶體管縮放技術逐漸放緩,現代中央處理器的創新越來越多地來自新的架構方法和系統集成,而非單純提升時鐘頻率。

(一)小芯片與模塊化中央處理器設計

一個重要趨勢是向基于小芯片的處理器設計轉型。制造商不再將中央處理器打造為單一的大型單片裸片,而是由多個處理特定功能(如計算核心、緩存或輸入輸出)的小型裸片(小芯片)組裝而成。

這種方式提高了制造良率,允許混合使用不同的制程節點,并使核心數量的擴展更加容易。AMD通過其基于禪架構的處理器率先推廣了這一策略,英特爾此后也采用了類似的模塊化封裝技術。


開蓋后的AMD銳龍5 3600處理器,展示了輸入輸出裸片(中左側)和核心復合裸片(右上側),核心復合裸片包含兩個四核核心復合體,出于芯片良率和產品分級的考慮,其中兩個核心被禁用。來源:維基百科

(二)向量擴展與數據并行性

另一項關鍵創新是向量和單指令多數據指令集的擴展,使中央處理器能夠通過單條指令處理大量數據元素。x86架構的流式單指令多數據擴展、高級向量擴展、高級向量擴展512和高級矩陣擴展,以及高級精簡指令集機器架構的高級SIMD擴展和可伸縮向量擴展等擴展技術,能夠對數據數組執行大規模并行操作,加速多媒體處理、科學模擬和機器學習等工作負載。

(三)超越傳統中央處理器:系統級芯片的崛起

現代處理器越來越多地表現為系統級芯片,而非簡單的中央處理器。系統級芯片將許多曾經獨立的芯片組件(如圖形處理器、內存控制器、輸入輸出接口和專用加速器)全部集成到單塊硅片上。

這種高度集成的設計大幅提升了能效,并減少了組件之間的延遲。如今的系統級芯片通常集成人工智能加速器、媒體引擎、安全處理器、圖形處理器和網絡硬件,使“中央處理器”從純粹的通用處理器轉變為單塊芯片上的完整計算平臺。

在很多方面,這一轉變重新定義了處理器的內涵。現代芯片不再僅由中央處理器核心構成,而是為處理各類工作負載(從圖形渲染到人工智能推理)設計的異構系統,所有組件均集成在單一封裝中。


英特爾 Raptor Lake系統級芯片架構示意圖。來源:維基芯片

(四)Apple Silicon:高級精簡指令集機器架構面向桌面端的重大革新

2020年,蘋果宣布將麥金塔電腦產品線從英特爾處理器過渡到自研的基于高級精簡指令集機器架構的Apple Silicon,首款產品為M1系統級芯片。這一過渡從2020年底發布的新款麥金塔電腦開始,并于2023年全面完成,標志著麥金塔平臺迎來重大架構變革。

通過自研處理器,蘋果實現了對中央處理器、圖形處理器和系統架構的全面掌控,能夠在蘋果桌面操作系統及其更廣泛的生態系統中實現硬件和軟件的深度整合。


蘋果M1芯片(左側)與兩枚低功耗雙倍數據率4X同步動態隨機存取存儲器芯片(右側)。來源:維基百科

與許多當代x86處理器相比,Apple Silicon的一個顯著特點是極高的每時鐘周期性能。多項架構設計選擇促成了這一優勢。

首先,蘋果的高性能核心采用了超寬微架構。例如,M1芯片中的風暴高性能核心每個時鐘周期最多可解碼8條指令,遠寬于許多主流桌面核心,能夠挖掘大量的指令級并行性。

其次,蘋果的處理器核心配備了超大容量的緩存,擁有異乎尋常的大容量一級數據/指令緩存和大型共享二級緩存,減少了內存延遲,使數據能夠更靠近執行單元。

最后,Apple Silicon被設計為高度集成的系統級芯片,將中央處理器核心與圖形處理器、神經引擎和其他加速器集成在同一塊裸片上。這種深度整合減少了數據傳輸,提升了整個系統的效率。

這些設計選擇共同使Apple Silicon實現了卓越的每瓦性能和高每時鐘周期性能吞吐量,證明基于高級精簡指令集機器架構的設計能夠直接與傳統桌面x86中央處理器競爭。

十一、結語

距離英特爾8086處理器推出已近五十年,中央處理器架構仍在以驚人的速度發展。早期的性能提升主要來自更高的時鐘頻率和更小的晶體管,而現代創新則越來越多地依靠并行性、專用化和系統級設計。

多項趨勢可能將定義下一代處理器的發展方向。小芯片架構和三維堆疊技術將繼續發展,使中央處理器能夠擴展為更大、更復雜的多裸片封裝,同時提高制造效率和良率。這種模塊化方式還能更輕松地混合使用不同的制程節點,并集成專用加速器。

與此同時,計算正變得越來越異構化。現代系統將通用中央處理器核心與圖形處理器、人工智能引擎、數字信號處理器和其他專用加速器相結合,每種組件都針對特定的工作負載(如圖形渲染、機器學習或信號處理)進行了優化。

新的指令集生態系統也在不斷涌現。盡管x86和高級精簡指令集機器架構在許多市場仍占據主導地位,但精簡指令集-V等開放架構正獲得越來越多的關注,尤其在嵌入式/物聯網系統、人工智能設備和定制硅芯片設計領域。

從很多方面來看,中央處理器的未來可能不再是單一的處理器,而更像是一組協同工作的專用計算引擎。但核心目標與1978年時始終一致:尋找新的方式,以更快的速度、更高的效率和更大的規模執行指令。

而中央處理器架構的發展歷史已經證明,下一項突破性創新或許正在某個實驗室中醞釀。

原文連接:

https://wccftech.com/the-evolution-of-cpu-architectures-from-intel-4004-to-modern-socs

邀約|AMD 技術日 :Physical AI - 機器人前沿(4.2,北京)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
拉薩市委書記調整

拉薩市委書記調整

觀察者網
2026-03-24 09:27:07
國際油價持續跳水 美油布油均跌近13%

國際油價持續跳水 美油布油均跌近13%

財聯社
2026-03-23 19:10:19
瑞幸官宣羅永浩!超大杯廣告笑不活了,網友:只有她能拿捏老羅!

瑞幸官宣羅永浩!超大杯廣告笑不活了,網友:只有她能拿捏老羅!

LOGO研究所
2026-03-23 12:18:30
情侶住酒店正親密時,酒店員工突然從外面打開房間窗戶。當事人:拒絕接受酒店的4000元補償

情侶住酒店正親密時,酒店員工突然從外面打開房間窗戶。當事人:拒絕接受酒店的4000元補償

觀威海
2026-03-24 09:39:01
黃仁勛堅定支持以色列

黃仁勛堅定支持以色列

Nee看
2026-03-23 11:06:29
這次破案了,中方追回走私稀土,價值46個億,美國砸重金收買內鬼

這次破案了,中方追回走私稀土,價值46個億,美國砸重金收買內鬼

影孖看世界
2026-03-23 23:29:51
陪玩陪睡只是冰山一角?張藝謀團隊曝猛料,讓女演員“小三逼婚”

陪玩陪睡只是冰山一角?張藝謀團隊曝猛料,讓女演員“小三逼婚”

TVB的四小花
2026-03-24 09:30:59
不夸張的說,這顏值在整個亞洲都是數一數二的

不夸張的說,這顏值在整個亞洲都是數一數二的

喜歡歷史的阿繁
2026-03-23 15:30:38
數據觸目驚心!一個小縣城的殯儀館里大屏幕流出,網友:還爭什么

數據觸目驚心!一個小縣城的殯儀館里大屏幕流出,網友:還爭什么

火山詩話
2026-03-23 10:18:33
我虧掉200萬啊!廣東一投資客深夜痛哭,稱對不起家人,是個廢人

我虧掉200萬啊!廣東一投資客深夜痛哭,稱對不起家人,是個廢人

火山詩話
2026-03-24 09:15:50
中國肺癌發病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

中國肺癌發病率世界第一!提醒:罪魁禍首已揪出,7種食物要少吃

健康之光
2026-03-23 20:10:05
人社部明確:事業編制改革啟動,3100萬人的“鐵飯碗”要變了

人社部明確:事業編制改革啟動,3100萬人的“鐵飯碗”要變了

慧眼看世界哈哈
2026-03-24 06:36:05
官方通報:張某某、焦某某,均不是公職人員

官方通報:張某某、焦某某,均不是公職人員

南方都市報
2026-03-24 11:00:40
太尷尬了!廣州男子用百元酒水招待朋友,可孩子突然拿出一瓶茅臺

太尷尬了!廣州男子用百元酒水招待朋友,可孩子突然拿出一瓶茅臺

火山詩話
2026-03-24 05:15:33
奴顏媚骨具象化,高市早苗三十年前照片被扒出,原來她從未變過!

奴顏媚骨具象化,高市早苗三十年前照片被扒出,原來她從未變過!

社會醬
2026-03-23 17:34:19
高瞻遠矚:中國兩個月進口1.59億桶俄羅斯石油!印度追悔莫及

高瞻遠矚:中國兩個月進口1.59億桶俄羅斯石油!印度追悔莫及

兵國大事
2026-03-23 20:05:14
孫某某百萬路虎慣犯實錘:以前擺平的事,現在擺不平了

孫某某百萬路虎慣犯實錘:以前擺平的事,現在擺不平了

社會日日鮮
2026-03-24 06:56:22
湖北省襄陽市人大常委會黨組副書記、副主任肖勇被查

湖北省襄陽市人大常委會黨組副書記、副主任肖勇被查

新京報
2026-03-24 10:12:10
心寒!委內瑞拉,為什么我們不再看到了

心寒!委內瑞拉,為什么我們不再看到了

民間胡扯老哥
2026-03-23 18:54:46
中國石化:當前成品油庫存能夠保障生產經營穩定 已制定多套預案

中國石化:當前成品油庫存能夠保障生產經營穩定 已制定多套預案

新京報
2026-03-23 17:44:06
2026-03-24 11:23:00
EETOP半導體社區 incentive-icons
EETOP半導體社區
國內著名的電子工程師社區
7398文章數 15637關注度
往期回顧 全部

數碼要聞

蘋果WWDC26全球開發者大會官宣6月9日開幕

頭條要聞

伊朗"特別感謝"西班牙首相:將其頭像貼在導彈上發射

頭條要聞

伊朗"特別感謝"西班牙首相:將其頭像貼在導彈上發射

體育要聞

不敢放手一搏,你拿什么去爭冠?

娛樂要聞

林峰張馨月全家浙江游 岳母幫忙帶女兒

財經要聞

很多人,都被黃金嚇怕了!

科技要聞

史上最大造芯計劃啟動,馬斯克胃口為何這么大

汽車要聞

我行我素的豪華 全新一代雷克薩斯更犀利了

態度原創

健康
親子
教育
家居
旅游

轉頭就暈的耳石癥,能開車上班嗎?

親子要聞

游樂園內四大安全殺手,家長一定要帶孩子規避風險!

教育要聞

已知7A?5B=46,求A?B=?

家居要聞

智慧生活 奢享家居

旅游要聞

3月免票潮 春季游更旺

無障礙瀏覽 進入關懷版