徹底看穿雙核CPU Intel與AMD多核處理器剖解

金剛光 2023-02-05 發(fā)布于遼寧

展開全文

一、雙的由來

所謂雙處理器，簡(jiǎn)單地說就是在一塊CPU基板上集成兩個(gè)處理器，并通過并行總線將各處理器連接起來。雙并不是一個(gè)新概念，而只是CMP(Chip Multi Processors，單芯片多處理器)中基本、簡(jiǎn)單、容易實(shí)現(xiàn)的一種類型。其實(shí)在RISC處理器領(lǐng)域，雙甚至多都早已經(jīng)實(shí)現(xiàn)。CMP早是由美國斯坦福大學(xué)提出的，其思想是在一塊芯片內(nèi)實(shí)現(xiàn)SMP(Symmetrical Multi-Processing，對(duì)稱多處理)架構(gòu)，且并行執(zhí)行不同的進(jìn)程。早在上個(gè)世紀(jì)末，惠普和IBM就已經(jīng)提出雙核處理器的可行性設(shè)計(jì)。IBM 在2001年就推出了基于雙的POWER4處理器，隨后是Sun和惠普公司，都先后推出了基于雙核架構(gòu)的UltraSPARC以及PA-RISC芯片，但此時(shí)雙處理器架構(gòu)還都是在高端的RISC領(lǐng)域，直到前不久Intel和AMD相繼推出自己的雙處理器，雙才真正走入了主流的X86領(lǐng)域。

MCM模塊內(nèi)封裝了4個(gè)Power4芯片，共有8個(gè)CPU

Intel和AMD之所以推出雙處理器，重要的原因是原有的普通單處理器的頻率難于提升，性能沒有質(zhì)的飛躍。由于頻率難于提升，Intel在發(fā)布3.8GHz的產(chǎn)品以后只得宣布停止4GHz的產(chǎn)品計(jì)劃；而AMD在實(shí)際頻率超過2GHz以后也無法大幅度提升，3GHz成為了AMD無法逾越的一道坎。正是在這種情況下，為了尋找新的賣點(diǎn)，Intel和AMD都不約而同地祭起了雙這面大旗。

Sun UltraSPARC IV雙核處理器

二、AMD雙處理器的簡(jiǎn)介

AMD目前的桌面平臺(tái)雙處理器代號(hào)為Toledo和Manchester，基本上可以簡(jiǎn)單看作是把兩個(gè)Athlon 64所采用的 Venice整合在同一個(gè)處理器內(nèi)部，每個(gè)都擁有獨(dú)立的512KB或1MB二級(jí)緩存，兩個(gè)共享Hyper Transport，從架構(gòu)上來說相對(duì)于目前的Athlon 64架構(gòu)并沒有任何改變。

與Intel的雙處理器不同的是，由于AMD的Athlon 64處理器內(nèi)部整和了內(nèi)存控制器，而且在當(dāng)初Athlon 64設(shè)計(jì)時(shí)就為雙做了考慮，但是仍然需要仲裁器來保證其緩存數(shù)據(jù)的一致性。AMD在此采用了SRQ(System Request Queue，系統(tǒng)請(qǐng)求隊(duì)列)技術(shù)，在工作的時(shí)候每一個(gè)都將其請(qǐng)求放在SRQ中，當(dāng)獲得資源之后請(qǐng)求將會(huì)被送往相應(yīng)的執(zhí)行，所以其緩存數(shù)據(jù)的一致性不需要通過北橋芯片，直接在處理器內(nèi)部就可以完成。與Intel的雙處理器相比，其優(yōu)點(diǎn)是緩存數(shù)據(jù)延遲得以大大降低。

AMD目前的桌面平臺(tái)雙處理器是Athlon 64 X2，其型號(hào)按照PR值分為3800+至4800+等幾種，同樣采用0.09微米制程，Socket 939接口，支持1GHz的Hyper Transport，當(dāng)然也都支持雙通道DDR內(nèi)存技術(shù)。

Athlon 64 X2

由于AMD雙處理器的仲裁器是在CPU內(nèi)部而不是在北橋芯片上，所以在主板芯片組的選擇上要比Intel雙處理器要寬松得多，甚至可以說與主板芯片組無關(guān)。理論上來說，任何Socket 939的主板通過更新BIOS都可以支持Athlon 64 X2。對(duì)普通消費(fèi)者而言，這樣可以保護(hù)已有的投資，而不必象Intel雙處理器那樣需要同時(shí)升級(jí)主板

三、Intel雙構(gòu)架剖析

AMD的“真?zhèn)坞p核論”雖無法立足，但它點(diǎn)出的英特爾雙核處理器可能出現(xiàn)前端總線資源爭(zhēng)搶的問題是否真是實(shí)情呢？對(duì)此，英特爾表示：AMD并不了解我們的產(chǎn)品和我們將來產(chǎn)品的技術(shù)走向，對(duì)自己的競(jìng)爭(zhēng)對(duì)手及其產(chǎn)品妄加猜測(cè)和評(píng)論的行為是不值得贊賞的。AMD曾經(jīng)指出奔騰版是兩個(gè)共享一個(gè)二級(jí)緩存，這就是一個(gè)非常明顯的錯(cuò)誤。事實(shí)上，奔騰版和奔騰D都是每個(gè)配有獨(dú)享的和二級(jí)緩存，不同的是英特爾將雙核爭(zhēng)用前端總線的任務(wù)仲裁功能放在了芯片組的北橋芯片中。

圖1：基于Smithfield衍生出的奔騰版和奔騰D，主要區(qū)別就在于奔騰版支持超線程，而奔騰D屏蔽了超線程功能。

按照“離得越近、走得越快”的集成電路設(shè)計(jì)原則，把這些功能組件集成在處理器中確實(shí)可以提高效率，減少延遲。不過，在臺(tái)式機(jī)還不可能在短期內(nèi)就支持4個(gè)內(nèi)核和更多內(nèi)核的現(xiàn)實(shí)情況下，只要有高帶寬的前端系統(tǒng)總線，就算把這些任務(wù)仲裁組件外置，對(duì)于雙核處理器的臺(tái)式機(jī)來說帶來的延遲和性能損失也是微乎其微的。

英特爾945和955系列芯片組目前可提供800MHz（用于目前的奔騰D）和1066MHz（用于奔騰版）前端總線，如果是供一個(gè)四核處理器使用，那肯定會(huì)造成資源爭(zhēng)搶，但對(duì)于雙核來說，這個(gè)帶寬已經(jīng)足夠了。英特爾認(rèn)為目前雙核系統(tǒng)中的主要瓶頸還是內(nèi)存、I/O總線和硬盤系統(tǒng)，提升這些模塊的速度才能使整個(gè)系統(tǒng)的計(jì)算平臺(tái)更加均衡。

基于這種設(shè)計(jì)思路，英特爾在945和955系列芯片組中加強(qiáng)了對(duì)PCI-Express總線的支持，增加了對(duì)更高速DDR2內(nèi)存的支持，對(duì)SATA(串行ATA)的支持速度增加了一倍由1.5Gb/s升級(jí)3Gb/s，進(jìn)一步增加了磁盤陣列RAID 5 和 RAID 10的支持。

圖2：?jiǎn)魏吮简v4處理器（左）和雙核奔騰D處理器（右）微架構(gòu)示意圖

此外，英特爾奔騰版有一個(gè)獨(dú)門“絕活”，那就是雙加超線程的架構(gòu)，這種架構(gòu)可同時(shí)處理四個(gè)線程，這讓它在多任務(wù)多線程的應(yīng)用中具有明顯優(yōu)勢(shì)。而且CMP與SMT（同時(shí)多線程，英特爾超線程就是一種SMT技術(shù)）的結(jié)合是業(yè)界公認(rèn)的處理器重要發(fā)展趨勢(shì)，早推出雙核處理器的IBM也是這一趨勢(shì)的推動(dòng)者。

圖3：奔騰版的雙核+超線程架構(gòu)讓它具備同時(shí)四線程處理能力

英特爾之所以在奔騰版和奔騰D上采用共享前端總線的雙核架構(gòu)，還是出于雙核架構(gòu)自身的緊湊設(shè)計(jì)和生產(chǎn)進(jìn)程方面的考慮，這種架構(gòu)使英特爾能夠迅速推出全系列的雙核處理器家族，加快雙核處理器的產(chǎn)品化，而且它帶來的成本優(yōu)勢(shì)也大大降低了奔騰版、奔騰D與現(xiàn)有主流單核處理器——奔騰4系列的差價(jià)，有利于雙核處理器在PC市場(chǎng)上的迅速普及。

四、AMD雙架構(gòu)剖析

從架構(gòu)上來看，Athlon 64 X2除了多個(gè)“芯”外與目前的Athlon 64并沒有任何區(qū)別。Athlon 64 X2的大多數(shù)技術(shù)特征、功能與目前市售的、基于AMD64架構(gòu)的處理器是一樣的，而且這些雙處理器仍將使用1GHz HyperTransport總線與芯片組連接及支持雙通道DDR內(nèi)存技術(shù)。

實(shí)際上Toledo就相當(dāng)于是兩個(gè)San Diego的Athlon 64處理器的集成，至于Manchester自然就相當(dāng)于兩個(gè)

Venice了—這也就是說，雙的Athlon 64 X2處理器均將支持SSE3指令集。

另外我們不難發(fā)現(xiàn)的是，AMD的臺(tái)式雙處理器的頻率與其單產(chǎn)品基本上處于同一水平上—這一點(diǎn)與Intel非常不一樣(Intel目前頻率的桌面單處理器達(dá)到了3.8GHz，而其頻率的雙處理器只不過3.2GHz)。當(dāng)然這并不難理解，因?yàn)锳thlon 64處理器，特別是采用了90nm SOI工藝的Athlon 64處理器的發(fā)熱量要比Intel的高頻率的Prescott處理器要低不少，所以自然可以采用比較高的工作頻率了(當(dāng)然從頻率的角度來看，Athlon 64 X2也還是低于Pentium D的)。

由于Intel受發(fā)熱量限制目前的雙處理器只有3.2GHz，因此在性能上肯定要比AMD的 Athlon 64 X2要低一些——不過Pentium D不如Athlon64 X2的地方并不僅僅只有這方面而已。在處理器的架構(gòu)上AMD也有其獨(dú)到之處，下圖所示就是AMD的雙處理器的架構(gòu)示意圖。

AMD的雙方案面臨一個(gè)重要的問題，就是隨著第二的出現(xiàn)，對(duì)內(nèi)存與I/O帶寬的資源將會(huì)出現(xiàn)爭(zhēng)奪，如何解決好這個(gè)問題是AMD雙處理器的性能的關(guān)鍵問題之一。與Pentium D不同的是，Athlon 64 X2的兩個(gè)內(nèi)核并不需要通過外部FSB通信這一途徑。Athlon 64 X2內(nèi)部整合了一個(gè)System Request Queue(SRQ)仲裁裝備，每一個(gè)將其請(qǐng)求放在SRQ中，當(dāng)獲得資源之后請(qǐng)求將會(huì)被送往相應(yīng)的執(zhí)行，所有的過程都在CPU范圍之內(nèi)完成。

AMD雙強(qiáng)調(diào)是真正將兩個(gè)崁入整合在一個(gè)硅晶內(nèi)核上，可以真正發(fā)揮雙效率，不像對(duì)手的產(chǎn)品事實(shí)上為兩個(gè)Packet的設(shè)計(jì)，會(huì)有兩個(gè)之間傳輸瓶頸的問題。因此Athlon 64 X2的架構(gòu)要優(yōu)于Pentium D架構(gòu)，尤其是在高負(fù)載的多線程/多任務(wù)的環(huán)境下，AMD的處理器將會(huì)表現(xiàn)出比Intel的處理器更好的性能。

此外，隨著第二的出現(xiàn)，對(duì)內(nèi)存與I/O帶寬的資源將會(huì)出現(xiàn)爭(zhēng)奪，如何解決好這個(gè)問題是AMD雙處理器的性能的關(guān)鍵問題之一。AMD信引入了Crossbar控制器，這個(gè)全新的控制器結(jié)合優(yōu)化的系統(tǒng)請(qǐng)求隊(duì)列，可以有效的降低這個(gè)問題的危害性。

AMD處理器集成的內(nèi)存控制器在進(jìn)化到雙時(shí)代表現(xiàn)出來的優(yōu)勢(shì)更加明顯，低延時(shí)的內(nèi)存控制器使得對(duì)CPU的緩存的依賴也大幅減少，在這樣的情況下，在日后過渡到多的時(shí)候，需要考慮的問題更多的是基于各個(gè)之間的連接。我們可以看到，兩個(gè)所采用的L2緩存也是分別獨(dú)享的，也就是兩個(gè)L2緩存中保存的數(shù)據(jù)是一致的。

實(shí)際的可利用容量和一個(gè)的L2緩存容量是相同的—這一點(diǎn)和Intel一樣。與Intel有所不同的是，AMD方案的兩個(gè)之間的通信是通過處理器內(nèi)部的Crossbar實(shí)現(xiàn)的。相比之下Intel的Pentium D處理器的之間的通信則是需要通過芯片組的MCH來進(jìn)行—這顯然比AMD的方案要帶來更多的延遲時(shí)間。不過AMD的架構(gòu)也并非十全十美，雙處理器仍然只支持雙通道DDR400內(nèi)存無疑是一個(gè)有些令人遺憾的地方—兩個(gè)處理器自然需要更大的內(nèi)存帶寬。要解決這個(gè)矛盾，只能使用全新的針腳設(shè)計(jì)，DDR2或許是一個(gè)不錯(cuò)的選擇。

Athlon 64 X2這樣的設(shè)計(jì)還有一個(gè)好處，那就是如果打算支持新的雙內(nèi)核處理器的話，對(duì)舊平臺(tái)而言的要求就是升級(jí)到BIOS就OK了，這將大大降低平臺(tái)的應(yīng)用、升級(jí)成本。當(dāng)然AMD沿用以前的內(nèi)存控制器也是有很大的好處的，那就是雙的Athlon 64 X2處理器可以在目前幾乎所有的Socket 939主板上使用。這方面AMD有著Intel無可比擬的優(yōu)勢(shì)—因?yàn)橐郧暗?15/925主板并不能支持Intel的雙處理器。

此外，與Pentium D是通過降低頻率來降低功耗不同，同樣采用0.0

9微米生產(chǎn)技術(shù)的Athlon 64 X2似乎并不需要面臨這樣的問題。這都得益于AMD在Athlon 64 X2處理器上所采用的“Dual Stress Liner”應(yīng)變硅技術(shù)。Dual Stress Liner技術(shù)是由AMD和IBM聯(lián)合開發(fā)的，據(jù)稱可以將半導(dǎo)體晶體管的響應(yīng)速度提高24％。

事實(shí)上，DSL很類似于英特爾在90nm生產(chǎn)技術(shù)中引入的應(yīng)變硅技術(shù)。我們都知道，晶體管越微細(xì)化，運(yùn)行速度就越高，但同時(shí)也會(huì)引發(fā)泄漏電流增加、開關(guān)效率降低，從而導(dǎo)致耗電和發(fā)熱量的增加。而DSL通過向晶體管的硅層施加應(yīng)力，同時(shí)實(shí)現(xiàn)了速度的提高與耗電量的降低。

與Intel使用的應(yīng)變硅不同，來自AMD和IBM的DSL能夠被用于兩種類型的晶體管：NMOS和PMOS(具有n和p通道)而無需使用極難獲得的硅鍺層，硅鍺層會(huì)增加成本，并且有可能影響芯片的產(chǎn)量。 DSL這種雙重性，讓它比英特爾的應(yīng)變硅更有效—DSL可以將晶體管的響應(yīng)速度提升24%，而應(yīng)變硅能提供的改進(jìn)在15-20%。

并且更重要的是，AMD和IBM 這項(xiàng)新技術(shù)對(duì)產(chǎn)量及生產(chǎn)成本并沒有任何負(fù)面影響。由于在生產(chǎn)時(shí)無需使用新的生產(chǎn)方法，所以使用標(biāo)準(zhǔn)生產(chǎn)設(shè)備和材料便可迅速展開量產(chǎn)。另外，配合使用硅絕緣膜構(gòu)造(SOI，絕緣體上硅)與應(yīng)變硅，還可生產(chǎn)性能更高、耗電更低的晶體管。AMD工程師們表示，DSL和SOI一起結(jié)合可以讓Athlon 64處理器的頻率潛力有大約16％的增長。而Athlon 64 X2的初始頻率與目前Athlon 64持平上也可以看到DSL技術(shù)的確很有效。

當(dāng)然，AMD也將在未來轉(zhuǎn)移更先進(jìn)的65nm生產(chǎn)線上，改進(jìn)他們的內(nèi)存控制器來對(duì)DDR2，DDR3和FB-DIMM等高性能內(nèi)存提供支持，也將開始使用更快的HyperTransport 2.0總線，及更有效的節(jié)能降耗技術(shù)。

五、雙技術(shù)與超線程技術(shù)的區(qū)別

超線程技術(shù)已經(jīng)不是什么新鮮事物了，但普通用戶可能與雙技術(shù)區(qū)分不開。例如開啟了超線程技術(shù)的Pentium 4 530與Pentium D 530在操作系統(tǒng)中都同樣被識(shí)別為兩顆處理器，它們究竟是不是一樣的呢？這個(gè)問題確實(shí)具有迷惑性。

其實(shí)，可以簡(jiǎn)單地把雙技術(shù)理解為兩個(gè)"物理"處理器，是一種"硬"的方式；而超線程技術(shù)只是兩個(gè)"邏輯"處理器，是一種"軟"的方式。

從原理上來說，超線程技術(shù)屬于Intel版本的多線程技術(shù)。這種技術(shù)可以讓單CPU擁有處理多線程的能力，而物理上只使用一個(gè)處理器。超線程技術(shù)為每個(gè)物理處理器設(shè)置了兩個(gè)入口-AS(Architecture State，架構(gòu)狀態(tài))接口，從而使操作系統(tǒng)等軟件將其識(shí)別為兩個(gè)邏輯處理器。這兩個(gè)邏輯處理器像傳統(tǒng)處理器一樣，都有獨(dú)立的IA-32架構(gòu)，它們可以分別進(jìn)入暫停、中斷狀態(tài)，或直接執(zhí)行特殊線程，并且每個(gè)邏輯處理器都擁有APIC(Advanced Programmable Interrupt Controller，可編程中斷控制器)。

雖然支持超線程的Pentium 4能同時(shí)執(zhí)行兩個(gè)線程，但不同于傳統(tǒng)的雙處理器平臺(tái)或雙內(nèi)核處理器，超線程中的兩個(gè)邏輯處理器并沒有獨(dú)立的執(zhí)行單元、整數(shù)單元、寄存器甚至緩存等等資源。它們?cè)谶\(yùn)行過程中仍需要共用執(zhí)行單元、緩存和系統(tǒng)總線接口。在執(zhí)行多線程時(shí)兩個(gè)邏輯處理器均是交替工作，如果兩個(gè)線程都同時(shí)需要某一個(gè)資源時(shí)，其中一個(gè)要暫停并要讓出資源，要待那些資源閑置時(shí)才能繼續(xù)。因此，超線程技術(shù)所帶來的性能提升遠(yuǎn)不能等同于兩個(gè)相同時(shí)鐘頻率處理器帶來的性能提升。可以說Intel的超線程技術(shù)僅可以看做是對(duì)單個(gè)處理器運(yùn)算資源的優(yōu)化利用。

而雙技術(shù)則是通過"硬"的物理實(shí)現(xiàn)多線程工作：每個(gè)擁有獨(dú)立的指令集、執(zhí)行單元，與超線程中所采用的模擬共享機(jī)制完全不一樣。在操作系統(tǒng)看來，它是實(shí)實(shí)在在的雙處理器，可以同時(shí)執(zhí)行多項(xiàng)任務(wù)，能讓處理器資源真正實(shí)現(xiàn)并行處理模式，其效率和性能提升要比超線程技術(shù)要高得多，不可同日而語。

六、雙處理器的適用范圍

目前，Windows XP版等操作系統(tǒng)支持雙物理和四個(gè)邏輯，但這并不意味著所有軟件對(duì)此都有優(yōu)化。

事實(shí)上大量的測(cè)試已經(jīng)證明，無論是Intel還是AMD的雙處理器，相對(duì)于其各自的同頻率的單處理器而言，對(duì)于目前的普通應(yīng)用例如多媒體軟件、游戲和辦公軟件等等都沒有任何性能提升，甚至可能還稍有降低，因?yàn)檫@些普通應(yīng)用目前都還只是單線程程序，在處理器執(zhí)行指令時(shí)實(shí)際上只有一個(gè)在工作，而另外一個(gè)則處于空閑狀態(tài)幫不上忙。

所以對(duì)普通用戶而言，只要日常應(yīng)用的程序仍然是單線程的話，雙處理器實(shí)際上沒有任何意義，反而還增大了購買成本。除非經(jīng)常執(zhí)行大運(yùn)算量的多任務(wù)處理，例如在游戲的同時(shí)進(jìn)行音視

頻處理等等，這時(shí)雙處理器才能真正發(fā)揮作用。

目前適合雙處理器發(fā)揮威力的平臺(tái)是服務(wù)器和工作站，這是因?yàn)槠浣?jīng)常進(jìn)行多任務(wù)處理，而且日常運(yùn)行的大量程序都是多線程程序，例如圖形工作站所使用的Adobe Photoshop和3D MAX等都是多線程程序。一般來說，在執(zhí)行多任務(wù)處理和多線程程序時(shí)，雙處理器要比同頻率的單處理器的性能要高大約50%-70%，甚至在某些應(yīng)用下性能幾乎能提升100%。

當(dāng)然，隨著雙處理器的強(qiáng)勢(shì)推出和逐漸普及，日后支持多線程的普通應(yīng)用程序也會(huì)逐漸增多，對(duì)普通用戶而言那時(shí)雙處理器才會(huì)真正發(fā)揮作用。

七、雙處理器目前所存在的問題

無論是Intel的Pentium D和Pentium EE，還是AMD的Athlon 64 X2處理器，都是簡(jiǎn)單地將兩個(gè)物理內(nèi)核"疊加"在一起，這必然帶來晶體管數(shù)量的大幅度增加，雙方都已經(jīng)達(dá)到了兩億三千萬個(gè)以上的晶體管；帶來的直接后果就是由泄漏電流引起的功耗大幅度增加，就算是采用了節(jié)能技術(shù)其發(fā)熱量也居高不下，從而導(dǎo)致雙處理器相對(duì)于單處理器而言頻率提升更加困難。

而且由于目前的制造工藝的限制，雙處理器的良品率要比單處理器的低，這必然會(huì)帶來成本的居高不下，所以目前的雙處理器的價(jià)格都太貴了，距離普及還差得很遠(yuǎn)。當(dāng)然，隨著處理器架構(gòu)和制造技術(shù)的發(fā)展，今后必然會(huì)解決目前所遇到的問題。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：金剛光 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)