一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

內(nèi)存頻率、內(nèi)存帶寬、CPU外頻、FSB、雙核、64位技術(shù)等基本

 大雨連綿 2012-07-29
網(wǎng)上找的,放這留個(gè)底,便于以后備查,懶得到處找了。

--------------------------------------------------
--------------------------------------------------
關(guān)于內(nèi)存頻率、內(nèi)存帶寬、CPU外頻、FSB之間的關(guān)系

  現(xiàn)在的單通道內(nèi)存控制器一般都是64bit的,8個(gè)2進(jìn)制bit相當(dāng)于1個(gè)字節(jié),換算成字節(jié)是64/8=8,再乘以內(nèi)存的運(yùn)行頻率,如果是DDR內(nèi)存就要再乘以2,因?yàn)樗且詓d內(nèi)存雙倍的速度傳輸數(shù)據(jù)的,所以
DDR266,運(yùn)行頻率為133MHz,帶寬為133*2*64/8=2100MB/s=2.1GB/s
DDR333,運(yùn)行頻率為166MHz,帶寬為166*2*64/8=2700MB/s=2.7GB/s
DDR400,運(yùn)行頻率為200MHz,帶寬為200*2*64/8=3200MB/s=3.2GB/s 

  所謂雙通道DDR,就是芯片組可以在兩個(gè)不同的數(shù)據(jù)通道上分別尋址、讀取數(shù)據(jù)。這兩個(gè)相互獨(dú)立工作的內(nèi)存通道是依附于兩個(gè)獨(dú)立并行工作的,位寬為64-bit的內(nèi)存控制器下,因此使普通的DDR內(nèi)存可以達(dá)到128-bit的位寬,因此,內(nèi)存帶寬是單通道的兩倍,因此
雙通道DDR266的帶寬為133*2*64/8*2=4200MB/s=4.2GB/s
雙通道DDR333的帶寬為166*2*64/8*2=5400MB/s=5.4GB/s
雙通道DDR400的帶寬為200*2*64/8*2=6400MB/s=6.4GB/s 

關(guān)于瓶徑問(wèn)題:
   CPU與北橋芯片之間的數(shù)據(jù)傳輸速率稱(chēng)前端總線(FSB),對(duì)于intel的主流平臺(tái),其采用Q/P總線技術(shù),F(xiàn)SB=CPU外頻*4,如賽揚(yáng)4的外頻 為100,其FSB為400,數(shù)據(jù)帶寬為3.2GB/s,P4A的外頻為100,其FSB為400,數(shù)據(jù)帶寬為3.2GB/s,P4B的外頻為133,其 FSB為533,數(shù)據(jù)帶寬為4.2GB/s,P4C、P4E的外頻為200,其FSB為800,數(shù)據(jù)帶寬為6.4GB/s,對(duì)于AMD的主流平臺(tái),其采用 EV6總線技術(shù),FSB=CPU外頻*2,對(duì)于Athlon XP,其外頻為133,166,200,對(duì)應(yīng)的FSB分別為266,333,400,數(shù)據(jù)帶 寬分別為2.1,2.7,3.2GB/s 

  FSB與內(nèi)存帶寬相等的情況下,則不存在瓶徑問(wèn)題,如果內(nèi)存帶寬小于FSB則形成內(nèi)存帶寬瓶徑,無(wú)法完全發(fā)揮系統(tǒng)的性能。 

   因此對(duì)于對(duì)于intel的主流平臺(tái),如賽揚(yáng)4的外頻為100,其FSB為400,數(shù)據(jù)帶寬為3.2GB/s,應(yīng)該使用DDR400或雙通道DDR200 以上,P4A的外頻為100,其FSB為400,數(shù)據(jù)帶寬為3.2GB/s,應(yīng)該使用DDR400或雙通道DDR200以上,P4B和C4D的外頻為 133,其FSB為533,數(shù)據(jù)帶寬為4.2GB/s,應(yīng)該使用DDR533或雙通道DDR266以上,P4C、P4E的外頻為200,其FSB為 800,數(shù)據(jù)帶寬為6.4GB/s,應(yīng)該使用雙通道DDR400以上,對(duì)于AMD的主流平臺(tái),Athlon XP,其外頻為133,166,200,應(yīng)該 分別使用DDR266,DDR333,DDR400,在這個(gè)平臺(tái)上沒(méi)必要使用雙通道內(nèi)存。

--------------------------------------------------

什么是FSB,它和CPU外頻有什么區(qū)別和聯(lián)系?

這個(gè)參數(shù)指的就是前端總線的頻率,它是處理器與主板交換數(shù)據(jù)的通道,既然是通道,那就是越大越好,現(xiàn)在主流中最高的FSB是800M,向下有533M、400M和333M等幾種,它們價(jià)格是遞減的。

FSB(或 是FrontSideBus,前端總線)是超頻最容易和最常見(jiàn)的方法之一。FSB是CPU與系統(tǒng)其它部分連接的速度。它還影響內(nèi)存時(shí)鐘,那是內(nèi)存運(yùn)行的速 度。一般而言,對(duì)FSB和內(nèi)存時(shí)鐘兩者來(lái)說(shuō)越高等于越好。然而,在某些情況下這不成立。例如,讓內(nèi)存時(shí)鐘比FSB運(yùn)行得快根本不會(huì)有真正的幫助。同樣,在 AthlonXP系統(tǒng)上,讓FSB運(yùn)行在更高速度下而強(qiáng)制內(nèi)存與FSB不同步(使用稍后將討論的內(nèi)存分頻器)對(duì)性能的阻礙將比運(yùn)行在較低FSB及同步內(nèi)存 下要嚴(yán)重得多。

  FSB在 Athlon和P4系統(tǒng)上涉及到不同的方法。在Athlon這邊,它是DDR總線,意味著如果實(shí)際時(shí)鐘是 200MHz的話,那就是運(yùn)行在400MHz下。在P4上,它是“四芯的”,所以如果實(shí)際時(shí)鐘是相同的200MHz的話,就代表800MHz。這是 Intel的市場(chǎng)策略,因?yàn)閷?duì)一般用戶來(lái)說(shuō),越高等于越好。Intel的“四芯”FSB實(shí)際上具有一個(gè)現(xiàn)實(shí)的優(yōu)勢(shì),那就是以較小的性能損失為代價(jià)允許P4 芯片與內(nèi)存不同步運(yùn)行。每個(gè)時(shí)鐘越高的周期速度使得它越有機(jī)會(huì)讓內(nèi)存周期與CPU周期重合,那等同于越好的性能。


    外頻是 CPU乃至整個(gè)計(jì)算機(jī)系統(tǒng)的基準(zhǔn)頻率,單位是MHz(兆赫茲)。在早期的電腦中,內(nèi)存與主板之間的同步運(yùn)行的速度等于外頻,在這種方式下,可以理解為 CPU外頻直接與內(nèi)存相連通,實(shí)現(xiàn)兩者間的同步運(yùn)行狀態(tài)。對(duì)于目前的計(jì)算機(jī)系統(tǒng)來(lái)說(shuō),兩者完全可以不相同,但是外頻的意義仍然存在,計(jì)算機(jī)系統(tǒng)中大多數(shù)的 頻率都是在外頻的基礎(chǔ)上,乘以一定的倍數(shù)來(lái)實(shí)現(xiàn),這個(gè)倍數(shù)可以是大于1的,也可以是小于1的。
Rd4C5w/e/\0外頻與前端總線(FSB) 頻率很容易被混為一談。前端總線的速度指的是CPU和北橋芯片間總線的速度,更實(shí)質(zhì)性的表示了CPU和外界數(shù)據(jù)傳輸?shù)乃俣取6忸l的概念是建立在數(shù)字脈沖 信號(hào)震蕩速度基礎(chǔ)之上的,也就是說(shuō),100MHz外頻特指數(shù)字脈沖信號(hào)在每秒鐘震蕩一萬(wàn)萬(wàn)次,它更多的影響了PCI及其他總線的頻率。之所以前端總線與外 頻這兩個(gè)概念容易混淆,主要的原因是在以前的很長(zhǎng)一段時(shí)間里(主要是在Pentium 4出現(xiàn)之前和剛出現(xiàn)Pentium 4時(shí)),前端總線頻率與外頻是 相同的,因此往往直接稱(chēng)前端總線為外頻,最終造成這樣的誤會(huì)。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人們發(fā)現(xiàn)前端總線頻率需要高于外頻,因此采用了 QDR(Quad Date Rate)技術(shù),或者其他類(lèi)似的技術(shù)實(shí)現(xiàn)這個(gè)目的。這些技術(shù)的原理類(lèi)似于AGP的2X或者4X,它們使得前端總線的頻率成為 外頻的2倍、4倍甚至更高,從此之后前端總線和外頻的區(qū)別才開(kāi)始被人們重視起來(lái)。

--------------------------------------------------

CPU : 什么是雙核處理器

雙 核與雙芯(Dual Core Vs. Dual CPU): AMD和Intel的雙核技術(shù)在物理結(jié)構(gòu)上也有很大不同之處。AMD將兩個(gè)內(nèi)核做在一個(gè) Die(晶元)上,通過(guò)直連架構(gòu)連接起來(lái),集成度更高。Intel 則是將放在不同Die(晶元)上的兩個(gè)內(nèi)核封裝在一起,因此有人將Intel的方案稱(chēng) 為“雙芯”,認(rèn)為AMD的方案才是真正的“雙核”。從用戶端的角度來(lái)看,AMD的方案能夠使雙核CPU的管腳、功耗等指標(biāo)跟單核CPU保持一致,從單核升 級(jí)到雙核,不需要更換電源、芯片組、散熱系統(tǒng)和主板,只需要刷新BIOS軟件即可,這對(duì)于主板廠商、計(jì)算機(jī)廠商和最終用戶的投資保護(hù)是非常有利的??蛻艨?以利用其現(xiàn)有的90納米基礎(chǔ)設(shè)施,通過(guò)BIOS更改移植到基于雙核心的系統(tǒng)。 

計(jì)算機(jī)廠商可以輕松地提供同一硬件的單核心與雙核心版本, 使那些既想提高性能又想保持IT環(huán)境穩(wěn)定性的客戶能夠在不中斷業(yè)務(wù)的情況下升級(jí)到雙核心。在一個(gè)機(jī)架密度較高的環(huán)境中,通過(guò)在保持電源與基礎(chǔ)設(shè)施投資不變 的情況下移植到雙核心,客戶的系統(tǒng)性能將得到巨大的提升。在同樣的系統(tǒng)占地空間上,通過(guò)使用雙核心處理器,客戶將獲得更高水平的計(jì)算能力和性能。

雙 核處理器(Dual Core Processor):雙核處理器是指在一個(gè)處理器上集成兩個(gè)運(yùn)算核心,從而提高計(jì)算能力。“雙核”的概念最早是由 IBM、HP、Sun等支持RISC架構(gòu)的高端服務(wù)器廠商提出的,不過(guò)由于RISC架構(gòu)的服務(wù)器價(jià)格高、應(yīng)用面窄,沒(méi)有引起廣泛的注意。 

最 近逐漸熱起來(lái)的“雙核”概念,主要是指基于X86開(kāi)放架構(gòu)的雙核技術(shù)。在這方面,起領(lǐng)導(dǎo)地位的廠商主要有AMD和 Intel兩家。其中,兩家的思路又有 不同。AMD從一開(kāi)始設(shè)計(jì)時(shí)就考慮到了對(duì)多核心的支持。所有組件都直接連接到CPU,消除系統(tǒng)架構(gòu)方面的挑戰(zhàn)和瓶頸。兩個(gè)處理器核心直接連接到同一個(gè)內(nèi)核 上,核心之間以芯片速度通信,進(jìn)一步降低了處理器之間的延遲。而Intel采用多個(gè)核心共享前端總線的方式。專(zhuān)家認(rèn)為,AMD的架構(gòu)對(duì)于更容易實(shí)現(xiàn)雙核以 至多核,Intel的架構(gòu)會(huì)遇到多個(gè)內(nèi)核爭(zhēng)用總線資源的瓶頸問(wèn)題。


    目前Intel推出的臺(tái)式機(jī)雙核心處理器有Pentium D、Pentium EE(Pentium Extreme Edition)和Core Duo三種類(lèi)型,三者的工作原理有很大不同。

    一、Pentium D和Pentium EE

    Pentium D 和Pentium EE分別面向主流市場(chǎng)以及高端市場(chǎng),其每個(gè)核心采用獨(dú)立式緩存設(shè)計(jì),在處理器內(nèi)部?jī)蓚€(gè)核心之間是互相隔絕的,通過(guò)處理器外部(主板北橋 芯片)的仲裁器負(fù)責(zé)兩個(gè)核心之間的任務(wù)分配以及緩存數(shù)據(jù)的同步等協(xié)調(diào)工作。兩個(gè)核心共享前端總線,并依靠前端總線在兩個(gè)核心之間傳輸緩存同步數(shù)據(jù)。從架構(gòu) 上來(lái)看,這種類(lèi)型是基于獨(dú)立緩存的松散型雙核心處理器耦合方案,其優(yōu)點(diǎn)是技術(shù)簡(jiǎn)單,只需要將兩個(gè)相同的處理器內(nèi)核封裝在同一塊基板上即可;缺點(diǎn)是數(shù)據(jù)延遲 問(wèn)題比較嚴(yán)重,性能并不盡如人意。另外,Pentium D和Pentium EE的最大區(qū)別就是Pentium EE支持超線程技術(shù)而 Pentium D則不支持,Pentium EE在打開(kāi)超線程技術(shù)之后會(huì)被操作系統(tǒng)識(shí)別為四個(gè)邏輯處理器。

 

AMD雙核處理器

    AMD推出的雙核心處理器分別是雙核心的Opteron系列和全新的Athlon 64 X2系列處理器。其中Athlon 64 X2是用以抗衡Pentium D和Pentium Extreme Edition的桌面雙核心處理器系列。

    AMD 推出的Athlon 64 X2是由兩個(gè)Athlon 64處理器上采用的Venice核心組合而成,每個(gè)核心擁有獨(dú)立的512KB(1MB) L2緩存 及執(zhí)行單元。除了多出一個(gè)核芯之外,從架構(gòu)上相對(duì)于目前Athlon 64在架構(gòu)上并沒(méi)有任何重大的改變。

    雙核心Athlon 64 X2的大部分規(guī)格、功能與我們熟悉的Athlon 64架構(gòu)沒(méi)有任何區(qū)別,也就是說(shuō)新推出的Athlon 64 X2雙核心處理器仍然支持1GHz規(guī)格的HyperTransport總線,并且內(nèi)建了支持雙通道設(shè)置的DDR內(nèi)存控制器。

    與 Intel雙核心處理器不同的是,Athlon 64 X2的兩個(gè)內(nèi)核并不需要經(jīng)過(guò)MCH進(jìn)行相互之間的協(xié)調(diào)。AMD在Athlon 64 X2雙核心處 理器的內(nèi)部提供了一個(gè)稱(chēng)為System Request Queue(系統(tǒng)請(qǐng)求隊(duì)列)的技術(shù),在工作的時(shí)候每一個(gè)核心都將其請(qǐng)求放在SRQ中,當(dāng)獲得資源 之后請(qǐng)求將會(huì)被送往相應(yīng)的執(zhí)行核心,也就是說(shuō)所有的處理過(guò)程都在CPU核心范圍之內(nèi)完成,并不需要借助外部設(shè)備。

 

   對(duì) 于雙核心架構(gòu),AMD的做法是將兩個(gè)核心整合在同一片硅晶內(nèi)核之中,而Intel的雙核心處理方式則更像是簡(jiǎn)單的將兩個(gè)核心做到一起而已。與 Intel 的雙核心架構(gòu)相比,AMD雙核心處理器系統(tǒng)不會(huì)在兩個(gè)核心之間存在傳輸瓶頸的問(wèn)題。因此從這個(gè)方面來(lái)說(shuō),Athlon 64 X2的架構(gòu)要明 顯優(yōu)于Pentium D架構(gòu)。

    雖然與Intel相比,AMD并不用擔(dān)心Prescott核心這樣的功耗和發(fā)熱大戶,但是同樣需 要為雙核心處理器考慮降低功耗的方式。為此AMD并沒(méi)有采用降低主頻的辦法,而是在其使用90nm工藝生產(chǎn)的Athlon 64 X2處理器中采用了所謂 的Dual Stress Liner應(yīng)變硅技術(shù),與SOI技術(shù)配合使用,能夠生產(chǎn)出性能更高、耗電更低的晶體管。

    AMD推出的Athlon 64 X2處理器給用戶帶來(lái)最實(shí)惠的好處就是,不需要更換平臺(tái)就能使用新推出的雙核心處理器,只要對(duì)老主板升級(jí)一下BIOS就可以了,這與Intel雙核心處理器必須更換新平臺(tái)才能支持的做法相比,升級(jí)雙核心系統(tǒng)會(huì)節(jié)省不少費(fèi)用。

-------------------------------------------------

CPU : 什么是64位技術(shù)

64 位 技術(shù):這里的64位技術(shù)是相對(duì)于32位而言的,這個(gè)位數(shù)指的是CPU GPRs(General-Purpose Registers,通用寄存器)的數(shù) 據(jù)寬度為64位,64位指令集就是運(yùn)行64位數(shù)據(jù)的指令,也就是說(shuō)處理器一次可以運(yùn)行64bit數(shù)據(jù)。64bit處理器并非現(xiàn)在才有的,在高端的 RISC(Reduced Instruction Set Computing,精簡(jiǎn)指令集計(jì)算機(jī))很早就有64bit處理器了,比如SUN公司的 UltraSparc Ⅲ、IBM公司的POWER5、HP公司的Alpha等。

64bit計(jì)算主要有兩大優(yōu)點(diǎn):可以進(jìn)行更大范圍的整數(shù) 運(yùn)算;可以支持更大的內(nèi)存。不能因?yàn)閿?shù)字上的變化,而簡(jiǎn)單的認(rèn)為64bit處理器的性能是32bit處理器性能的兩倍。實(shí)際上在32bit應(yīng)用 下,32bit處理器的性能甚至?xí)鼜?qiáng),即使是64bit處理器,目前情況下也是在32bit應(yīng)用下性能更強(qiáng)。所以要認(rèn)清64bit處理器的優(yōu)勢(shì),但不可 迷信64bit。

要實(shí)現(xiàn)真正意義上的64位計(jì)算,光有64位的處理器是不行的,還必須得有64位的操作系統(tǒng)以及64位的應(yīng)用軟件才行,三 者缺一不可,缺少其中任何一種要素都是無(wú)法實(shí)現(xiàn)64位計(jì)算的。目前,在64位處理器方面,Intel和AMD兩大處理器廠商都發(fā)布了多個(gè)系列多種規(guī)格的 64位處理器;而在操作系統(tǒng)和應(yīng)用軟件方面,目前的情況不容樂(lè)觀。因?yàn)檎嬲m合于個(gè)人使用的64位操作系統(tǒng)現(xiàn)在就只有Windows XP X64,而 Windows XP X64本身也只是一個(gè)過(guò)渡性質(zhì)的64位操作系統(tǒng),在Windows Vista發(fā)布以后就將被淘汰,而且 Windows XP X64本身也不太完善,易用性不高,一個(gè)明顯的例子就是各種硬件設(shè)備的驅(qū)動(dòng)程序很不完善,而且現(xiàn)在64位的應(yīng)用軟件還基本上沒(méi)有, 確實(shí)硬件廠商和軟件廠商也不愿意去為一個(gè)過(guò)渡性質(zhì)的操作系統(tǒng)編寫(xiě)驅(qū)動(dòng)程序和應(yīng)用軟件。所以要想實(shí)現(xiàn)真正的64位計(jì)算,恐怕還得等到 Windows Vista普及一段時(shí)間之后才行。

目前主流CPU使用的64位技術(shù)主要有AMD公司的AMD64位技術(shù)、Intel公司 的EM64T技術(shù)、和 Intel公司的IA-64技術(shù)。其中IA-64是Intel獨(dú)立開(kāi)發(fā),不兼容現(xiàn)在的傳統(tǒng)的32位計(jì)算機(jī),僅用于 Itanium(安騰)以及后續(xù)產(chǎn)品 Itanium 2,一般用戶不會(huì)涉及到,因此這里僅對(duì)AMD64位技術(shù)和Intel的EM64T技術(shù)做一下簡(jiǎn)單介 紹。

AMD64位技術(shù)X86-64:
AMD64 的位技術(shù)是在原始32位X86指令集的基礎(chǔ)上加入了X86-64擴(kuò)展64位 X86指令集,使這款芯片在硬件上兼容原來(lái)的32位X86軟件,并同時(shí)支持 X86-64的擴(kuò)展64位計(jì)算,使得這款芯片成為真正的64位X86芯片。這 是一個(gè)真正的64位的標(biāo)準(zhǔn),X86-64具有64位的尋址能力。

X86-64新增的幾組CPU寄存器將提供更快的執(zhí)行效率。寄存器是 CPU內(nèi)部用來(lái)創(chuàng)建和儲(chǔ)存CPU運(yùn)算結(jié)果和其它運(yùn)算結(jié)果的地方。標(biāo)準(zhǔn)的32-bit x86架構(gòu)包括8個(gè)通用寄存器(GPR),AMD在X86-64中又 增加了8組(R8-R9),將寄存器的數(shù)目提高到了16組。X86-64寄存器默認(rèn)位 64-bit。還增加了8組128-bit XMM寄存器(也叫 SSE寄存器,XMM8-XMM15),將能給單指令多數(shù)據(jù)流技術(shù)(SIMD)運(yùn)算提供更多的空間,這些128位的寄存器將提供在矢量和標(biāo)量計(jì)算模式下進(jìn) 行128位雙精度處理,為3D建模、矢量分析和虛擬現(xiàn)實(shí)的實(shí)現(xiàn)提供了硬件基礎(chǔ)。通過(guò)提供了更多的寄存器,按照X86-64標(biāo)準(zhǔn)生產(chǎn)的 CPU可以更有效的 處理數(shù)據(jù),可以在一個(gè)時(shí)鐘周期中傳輸更多的信息。

 

 

EM64T技術(shù)
Intel 官方是給 EM64T這樣定義的:EM64T全稱(chēng)Extended Memory 64 Technology,即擴(kuò)展64bit內(nèi)存技術(shù)。EM64T是 Intel IA-32架構(gòu)的擴(kuò)展,即IA-32e(Intel Architectur-32 extension)。IA-32處理器通過(guò)附加 EM64T技術(shù),便可在兼容IA-32軟件的情況下,允許軟件利用更多的內(nèi)存地址空間,并且允許軟件進(jìn)行 32 bit線性地址寫(xiě)入。EM64T特別強(qiáng)調(diào) 的是對(duì)32 bit和64 bit的兼容性。Intel為新核心增加了8個(gè)64 bit GPRs(R8-R15),并且把原有GRPs全部擴(kuò)展為 64 bit,這樣可以提高整數(shù)運(yùn)算能力。增加8個(gè)128bit SSE寄存器(XMM8-XMM15),是為了增強(qiáng)多媒體性能,包括對(duì)SSE、SSE2 和SSE3的支持。

Intel為支持EM64T技術(shù)的處理器設(shè)計(jì)了兩大模式:傳統(tǒng)IA-32模式(legacy IA-32 mode) 和IA-32e擴(kuò)展模式(IA-32e mode)。在支持EM64T技術(shù)的處理器內(nèi)有一個(gè)稱(chēng)之為擴(kuò)展功能激活寄存器 (extended feature enable register,IA32_EFER)的部件,其中的Bit10控制著EM64T是否激活。 Bit10被稱(chēng)作IA-32e模式有效(IA-32e mode active)或長(zhǎng)模式有效(long mode active,LMA)。當(dāng) LMA=0時(shí),處理器便作為一顆標(biāo)準(zhǔn)的32 bit(IA32)處理器運(yùn)行在傳統(tǒng)IA-32模式;當(dāng)LMA=1時(shí),EM64T便被激活,處理器會(huì)運(yùn)行在 IA-32e擴(kuò)展模式下。

目前AMD方面支持64位技術(shù)的CPU有Athlon 64系列、Athlon FX系列和Opteron系 列。Intel方面支持64位技術(shù)的CPU有使用Nocona核心的Xeon系列、使用Prescott 2M核心的Pentium 4 6系列和使用 Prescott 2M核心的P4 EE系列。

 

淺談 EM64T技術(shù)和AMD64區(qū)別X86-64 (AMD64 / EM64T) :
AMD 公 司設(shè)計(jì),可以在同一時(shí)間內(nèi)處理64位的整數(shù)運(yùn)算,并兼容于X86-32架構(gòu)。其中支持64位邏輯定址,同時(shí)提供轉(zhuǎn)換為32位定址選項(xiàng);但數(shù)據(jù)操作指令默認(rèn) 為32位和8位,提供轉(zhuǎn)換成64位和16位的選項(xiàng);支持常規(guī)用途寄存器,如果是32位運(yùn)算操作,就要將結(jié)果擴(kuò)展成完整的64位。這樣,指令中有“直接執(zhí) 行”和“轉(zhuǎn)換執(zhí)行”的區(qū)別,其指令字段是8位或32位,可以避免字段過(guò)長(zhǎng)。

x86-64(AMD64)的產(chǎn)生也并非空穴來(lái)風(fēng),x86處理 器的32bit尋址空間限制在4GB內(nèi)存,而IA- 64的處理器又不能兼容x86。 AMD充分考慮顧客的需求,加強(qiáng)x86指令集的功能,使這套指令集 可同時(shí)支持64位的運(yùn)算模式,因此AMD把它們的結(jié)構(gòu)稱(chēng)之為x86-64。在技術(shù)上 AMD在x86-64架構(gòu)中為了進(jìn)行64位運(yùn)算,AMD為其引入了新 增了R8-R15通用寄存器作為原有X86處理器寄存器的擴(kuò)充,但在而在32位環(huán)境下并不完全使用到這些寄存器。原來(lái)的寄存器諸如EAX、EBX也由32 位擴(kuò)張至64位。在SSE單元中新加入了8個(gè)新寄存器以提供對(duì)SSE2的支持。寄存器數(shù)量的增加將帶來(lái)性能的提升。與此同時(shí),為了同時(shí)支持32和64位代 碼及寄存器,x86-64架構(gòu)允許處理器工作在以下兩種模式:Long Mode(長(zhǎng)模式)和Legacy Mode(遺傳模式),Long模式又分為兩 種子模式(64bit模式和Compatibility mode兼容模式)。該標(biāo)準(zhǔn)已經(jīng)被引進(jìn)在AMD服務(wù)器處理器中的Opteron處理器。

而 今年也推出了支持64位的EM64T技術(shù),再還沒(méi)被正式命為EM64T之前是IA32E,這是英特爾64位擴(kuò)展技術(shù)的名字,用來(lái)區(qū)別X86指令集。 Intel的EM64T支持64位sub-mode,和AMD的X86-64技術(shù)類(lèi)似,采用64位的線性平面尋址,加入 8個(gè)新的通用寄存器 (GPRs),還增加8個(gè)寄存器支持SSE指令。與AMD相類(lèi)似,Intel的64位技術(shù)將兼容IA32和IA32E,只有在運(yùn)行64 位操作系統(tǒng)下的時(shí) 候,才將會(huì)采用IA32E。IA32E將由2個(gè)sub-mode組成:64位sub-mode和32位sub-mode,同AMD64一樣是向下兼容 的。 Intel的EM64T將完全兼容AMD的X86-64技術(shù)。現(xiàn)在Nocona處理器已經(jīng)加入了一些64位技術(shù),Intel的Pentium 4E 處理器也支持64位技術(shù)。

應(yīng)該說(shuō),這兩者都是兼容x86指令集的64位微處理器架構(gòu),但EM64T與AMD64還是有一些不一樣的地方,AMD64處理器中的NX位在Intel的處理器中將沒(méi)有提供。

-------

CPU : 二級(jí)緩存容量


  CPU緩存(Cache Memoney)位于CPU與內(nèi)存之間的臨時(shí)存儲(chǔ)器,它的容量比內(nèi)存小但 交換速度快。在緩存中的數(shù)據(jù)是內(nèi)存中的一小部分,但這一小部分是短時(shí)間內(nèi)CPU即將訪問(wèn)的,當(dāng)CPU調(diào)用大量數(shù)據(jù)時(shí),就可避開(kāi)內(nèi)存直接從緩存中調(diào)用,從而 加快讀取速度。由此可見(jiàn),在CPU中加入緩存是一種高效的解決方案,這樣整個(gè)內(nèi)存儲(chǔ)器(緩存+內(nèi)存)就變成了既有緩存的高速度,又有內(nèi)存的大容量的存儲(chǔ)系 統(tǒng)了。緩存對(duì)CPU的性能影響很大,主要是因?yàn)镃PU的數(shù)據(jù)交換順序和CPU與緩存間的帶寬引起的?!?br>
  緩存的工作原理是當(dāng)CPU要讀 取一個(gè)數(shù)據(jù)時(shí),首先從緩存中查找,如果找到就立即讀取并送給CPU處理;如果沒(méi)有找到,就用相對(duì)慢的速度從內(nèi)存中讀取并送給CPU處理,同時(shí)把這個(gè)數(shù)據(jù)所 在的數(shù)據(jù)塊調(diào)入緩存中,可以使得以后對(duì)整塊數(shù)據(jù)的讀取都從緩存中進(jìn)行,不必再調(diào)用內(nèi)存。

  正是這樣的讀取機(jī)制使CPU讀取緩存的命中率 非常高(大多數(shù)CPU可達(dá)90%左右),也就是說(shuō)CPU下一次要讀取的數(shù)據(jù)90%都在緩存中,只有大約10%需要從內(nèi)存讀取。這大大節(jié)省了CPU直接讀取 內(nèi)存的時(shí)間,也使CPU讀取數(shù)據(jù)時(shí)基本無(wú)需等待??偟膩?lái)說(shuō),CPU 讀取數(shù)據(jù)的順序是先緩存后內(nèi)存。

  最早先的CPU緩存是個(gè)整體的, 而且容量很低,英特爾公司從Pentium時(shí)代開(kāi)始把緩存進(jìn)行了分類(lèi)。當(dāng)時(shí)集成在CPU內(nèi)核中的緩存已不足以滿足CPU的需求,而制造工藝上的限制又不能 大幅度提高緩存的容量。因此出現(xiàn)了集成在與CPU同一塊電路板上或主板上的緩存,此時(shí)就把 CPU內(nèi)核集成的緩存稱(chēng)為一級(jí)緩存,而外部的稱(chēng)為二級(jí)緩存。一 級(jí)緩存中還分?jǐn)?shù)據(jù)緩存(I-Cache)和指令緩存(D-Cache)。二者分別用來(lái)存放數(shù)據(jù)和執(zhí)行這些數(shù)據(jù)的指令,而且兩者可以同時(shí)被CPU訪問(wèn),減少 了爭(zhēng)用Cache所造成的沖突,提高了處理器效能。英特爾公司在推出Pentium 4處理器時(shí),還新增了一種一級(jí)追蹤緩存,容量為12KB.

   隨著CPU制造工藝的發(fā)展,二級(jí)緩存也能輕易的集成在CPU內(nèi)核中,容量也在逐年提升?,F(xiàn)在再用集成在CPU內(nèi)部與否來(lái)定義一、二級(jí)緩存,已不確切。而 且隨著二級(jí)緩存被集成入CPU內(nèi)核中,以往二級(jí)緩存與CPU大差距分頻的情況也被改變,此時(shí)其以相同于主頻的速度工作,可以為CPU提供更高的傳輸速度。

  二級(jí)緩存是CPU性能表現(xiàn)的關(guān)鍵之一,在CPU核心不變化的情況下,增加二級(jí)緩存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二級(jí)緩存上有差異,由此可見(jiàn)二級(jí)緩存對(duì)于CPU的重要性。

   CPU在緩存中找到有用的數(shù)據(jù)被稱(chēng)為命中,當(dāng)緩存中沒(méi)有CPU所需的數(shù)據(jù)時(shí)(這時(shí)稱(chēng)為未命中),CPU才訪問(wèn)內(nèi)存。從理論上講,在一顆擁有二級(jí)緩存的 CPU中,讀取一級(jí)緩存的命中率為80%。也就是說(shuō)CPU一級(jí)緩存中找到的有用數(shù)據(jù)占數(shù)據(jù)總量的80%,剩下的 20%從二級(jí)緩存中讀取。由于不能準(zhǔn)確預(yù) 測(cè)將要執(zhí)行的數(shù)據(jù),讀取二級(jí)緩存的命中率也在80%左右(從二級(jí)緩存讀到有用的數(shù)據(jù)占總數(shù)據(jù)的16%)。那么還有的數(shù)據(jù)就不得不從內(nèi)存調(diào)用,但這已經(jīng)是一 個(gè)相當(dāng)小的比例了。目前的較高端的CPU中,還會(huì)帶有三級(jí)緩存,它是為讀取二級(jí)緩存后未命中的數(shù)據(jù)設(shè)計(jì)的—種緩存,在擁有三級(jí)緩存的CPU中,只有約5% 的數(shù)據(jù)需要從內(nèi)存中調(diào)用,這進(jìn)一步提高了CPU的效率。

  為了保證CPU訪問(wèn)時(shí)有較高的命中率,緩存中的內(nèi)容應(yīng)該按一定的算法替換。一 種較常用的算法是“最近最少使用算法”(LRU算法),它是將最近一段時(shí)間內(nèi)最少被訪問(wèn)過(guò)的行淘汰出局。因此需要為每行設(shè)置一個(gè)計(jì)數(shù)器,LRU算法是把命 中行的計(jì)數(shù)器清零,其他各行計(jì)數(shù)器加1。當(dāng)需要替換時(shí)淘汰行計(jì)數(shù)器計(jì)數(shù)值最大的數(shù)據(jù)行出局。這是一種高效、科學(xué)的算法,其計(jì)數(shù)器清零過(guò)程可以把一些頻繁調(diào) 用后再不需要的數(shù)據(jù)淘汰出緩存,提高緩存的利用率。

  CPU產(chǎn)品中,一級(jí)緩存的容量基本在4KB到18KB之間,二級(jí)緩存的容量則分為 128KB、256KB、 512KB、1MB等。一級(jí)緩存容量各產(chǎn)品之間相差不大,而二級(jí)緩存容量則是提高CPU性能的關(guān)鍵。二級(jí)緩存容量的提升是由 CPU制造工藝所決定的,容量增大必然導(dǎo)致CPU內(nèi)部晶體管數(shù)的增加,要在有限的CPU面積上集成更大的緩存,對(duì)制造工藝的要求也就越高。

    雙核心CPU的二級(jí)緩存比較特殊,和以前的單核心CPU相比,最重要的就是兩個(gè)內(nèi)核的緩存所保存的數(shù)據(jù)要保持一致,否則就會(huì)出現(xiàn)錯(cuò)誤,為了解決這個(gè)問(wèn)題不同的CPU使用了不同的辦法:

Intel雙核心處理器的二級(jí)緩存

 目 前Intel的雙核心CPU主要有Pentium D、Pentium EE、Core Duo三種,其中Pentium D、Pentium EE的二 級(jí)緩存方式完全相同。Pentium D和Pentium EE的二級(jí)緩存都是CPU內(nèi)部?jī)蓚€(gè)內(nèi)核具有互相獨(dú)立的二級(jí)緩存,其中,8xx系列的 Smithfield核心CPU為每核心1MB,而9xx系列的 Presler核心CPU為每核心2MB。這種CPU內(nèi)部的兩個(gè)內(nèi)核之間的緩存數(shù)據(jù)同步 是依靠位于主板北橋芯片上的仲裁單元通過(guò)前端總線在兩個(gè)核心之間傳輸來(lái)實(shí)現(xiàn)的,所以其數(shù)據(jù)延遲問(wèn)題比較嚴(yán)重,性能并不盡如人意。愛(ài)好者博墅P!m o)q9K"\b
    Core Duo使用的核心為Yonah,它的二級(jí)緩存則是兩個(gè)核心共享2MB的二級(jí)緩存,共享式的二級(jí)緩存配合 Intel的“Smart cache”共享緩存技術(shù),實(shí)現(xiàn)了真正意義上的緩存數(shù)據(jù)同步,大幅度降低了數(shù)據(jù)延遲,減少了對(duì)前端總線的占用,性能表現(xiàn)不錯(cuò), 是目前雙核心處理器上最先進(jìn)的二級(jí)緩存架構(gòu)。今后Intel的雙核心處理器的二級(jí)緩存都會(huì)采用這種兩個(gè)內(nèi)核共享二級(jí)緩存的“Smart cache”共享 緩存技術(shù)。

AMD雙核心處理器的二級(jí)緩存
    Athlon 64 X2 CPU的核心主要有Manchester和 Toledo兩種,他們的二級(jí)緩存都是CPU內(nèi)部?jī)蓚€(gè)內(nèi)核具有互相獨(dú)立的二級(jí)緩存,其中,Manchester 核心為每核心512KB,而Toledo 核心為每核心1MB。處理器內(nèi)部的兩個(gè)內(nèi)核之間的緩存數(shù)據(jù)同步是依靠CPU內(nèi)置的System Request Interface(系統(tǒng)請(qǐng)求接 口,SRI)控制,傳輸在CPU內(nèi)部即可實(shí)現(xiàn)。這樣一來(lái),不但CPU資源占用很小,而且不必占用內(nèi)存總線資源,數(shù)據(jù)延遲也比Intel的 Smithfield核心和Presler核心大為減少,協(xié)作效率明顯勝過(guò)這兩種核心。不過(guò),由于這種方式仍然是兩個(gè)內(nèi)核的緩存相互獨(dú)立,從架構(gòu)上來(lái)看也 明顯不如以Yonah核心為代表的Intel的共享緩存技術(shù)Smart Cache。

-----------

CPU : 多媒體指令集

  CPU依靠指令來(lái)計(jì)算和控制系統(tǒng),每款CPU在設(shè)計(jì)時(shí)就規(guī)定了一系列與其硬件電路相配合的指令系統(tǒng)。指令的 強(qiáng)弱也是CPU的重要指標(biāo),指令集是提高微處理器效率的最有效工具之一。從現(xiàn)階段的主流體系結(jié)構(gòu)講,指令集可分為復(fù)雜指令集和精簡(jiǎn)指令集兩部分,而從具體 運(yùn)用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming- Single instruction multiple data-Extensions 2)和AMD的3DNow!等都是CPU的擴(kuò)展指令集,分別 增強(qiáng)了CPU的多媒體、圖形圖象和Internet等的處理能力。我們通常會(huì)把CPU的擴(kuò)展指令集稱(chēng)為"CPU的指令集"。

1、精簡(jiǎn)指令集的運(yùn)用

   在最初發(fā)明計(jì)算機(jī)的數(shù)十年里,隨著計(jì)算機(jī)功能日趨增大,性能日趨變強(qiáng),內(nèi)部元器件也越來(lái)越多,指令集日趨復(fù)雜,過(guò)于冗雜的指令嚴(yán)重的影響了計(jì)算機(jī)的工作 效率。后來(lái)經(jīng)過(guò)研究發(fā)現(xiàn),在計(jì)算機(jī)中,80%程序只用到了20%的指令集,基于這一發(fā)現(xiàn),RISC精簡(jiǎn)指令集被提了出來(lái),這是計(jì)算機(jī)系統(tǒng)架構(gòu)的一次深刻革 命。RISC體系結(jié)構(gòu)的基本思路是:抓住CISC指令系統(tǒng)指令種類(lèi)太多、指令格式不規(guī)范、尋址方式太多的缺點(diǎn),通過(guò)減少指令種類(lèi)、規(guī)范指令格式和簡(jiǎn)化尋址 方式,方便處理器內(nèi)部的并行處理,提高VLSI器件的使用效率,從而大幅度地提高處理器的性能。

  RISC指令集有許多特征,其中最重要的有:

指令種類(lèi)少,指令格式規(guī)范:RISC指令集通常只使用一種或少數(shù)幾種格式。指令長(zhǎng)度單一(一般4個(gè)字節(jié)),并且在字邊界上對(duì)齊,字段位置、特別是操作碼的位置是固定的。

尋址方式簡(jiǎn)化:幾乎所有指令都使用寄存器尋址方式,尋址方式總數(shù)一般不超過(guò)5個(gè)。其他更為復(fù)雜的尋址方式,如間接尋址等則由軟件利用簡(jiǎn)單的尋址方式來(lái)合成。

大量利用寄存器間操作:RISC指令集中大多數(shù)操作都是寄存器到寄存器操作,只以簡(jiǎn)單的Load和Store操作訪問(wèn)內(nèi)存。因此,每條指令中訪問(wèn)的內(nèi)存地址不會(huì)超過(guò)1個(gè),訪問(wèn)內(nèi)存的操作不會(huì)與算術(shù)操作混在一起。 愛(ài)好者博
`
簡(jiǎn) 化處理器結(jié)構(gòu):使用RISC指令集,可以大大簡(jiǎn)化處理器的控制器和其他功能單元的設(shè)計(jì),不必使用大量專(zhuān)用寄存器,特別是允許以硬件線路來(lái)實(shí)現(xiàn)指令操作,而 不必像CISC處理器那樣使用微程序來(lái)實(shí)現(xiàn)指令操作。因此RISC處理器不必像CISC處理器那樣設(shè)置微程序控制存儲(chǔ)器,就能夠快速地直接執(zhí)行指令。

便 于使用VLSI技術(shù):隨著LSI和VLSI技術(shù)的發(fā)展,整個(gè)處理器(甚至多個(gè)處理器)都可以放在一個(gè)芯片上。RISC體系結(jié)構(gòu)可以給設(shè)計(jì)單芯片處理器帶來(lái) 很多好處,有利于提高性能,簡(jiǎn)化VLSI芯片的設(shè)計(jì)和實(shí)現(xiàn)。基于VLSI技術(shù),制造RISC處理器要比CISC處理器工作量小得多,成本也低得多。

加強(qiáng)了處理器并行能力:RISC指令集能夠非常有效地適合于采用流水線、超流水線和超標(biāo)量技術(shù),從而實(shí)現(xiàn)指令級(jí)并行操作,提高處理器的性能。目前常用的處理器內(nèi)部并行操作技術(shù)基本上是基于RISC體系結(jié)構(gòu)發(fā)展和走向成熟的。
    正由于RISC體系所具有的優(yōu)勢(shì),它在高端系統(tǒng)得到了廣泛的應(yīng)用,而CISC體系則在桌面系統(tǒng)中占據(jù)統(tǒng)治地位。而在如今,在桌面領(lǐng)域,RISC也不斷滲透,預(yù)計(jì)未來(lái),RISC將要一統(tǒng)江湖。

2、CPU的擴(kuò)展指令集

  對(duì)于CPU來(lái)說(shuō),在基本功能方面,它們的差別并不太大,基本的指令集也都差不多,但是許多廠家為了提升某一方面性能,又開(kāi)發(fā)了擴(kuò)展指令集,擴(kuò)展指令集定義了新的數(shù)據(jù)和指令,能夠大大提高某方面數(shù)據(jù)處理能力,但必需要有軟件支持。

MMX 指令集
   MMX(Multi Media eXtension,多媒體擴(kuò)展指令集)指令集是Intel公司于1996年推出的一項(xiàng)多媒體指令增強(qiáng)技術(shù)。MMX指 令集中包括有57條多媒體指令,通過(guò)這些指令可以一次處理多個(gè)數(shù)據(jù),在處理結(jié)果超過(guò)實(shí)際處理能力的時(shí)候也能進(jìn)行正常處理,這樣在軟件的配合下,就可以得到 更高的性能。MMX的益處在于,當(dāng)時(shí)存在的操作系統(tǒng)不必為此而做出任何修改便可以輕松地執(zhí)行MMX程序。但是,問(wèn)題也比較明顯,那就是MMX指令集與 x87浮點(diǎn)運(yùn)算指令不能夠同時(shí)執(zhí)行,必須做密集式的交錯(cuò)切換才可以正常執(zhí)行,這種情況就勢(shì)必造成整個(gè)系統(tǒng)運(yùn)行質(zhì)量的下降。

SSE指令集
   SSE(Streaming SIMD Extensions,單指令多數(shù)據(jù)流擴(kuò)展)指令集是Intel在Pentium III處理器中率先推出的。 其實(shí),早在PIII正式推出之前,Intel公司就曾經(jīng)通過(guò)各種渠道公布過(guò)所謂的KNI(Katmai New Instruction)指令集,這個(gè)指 令集也就是SSE指令集的前身,并一度被很多傳媒稱(chēng)之為MMX指令集的下一個(gè)版本,即MMX2指令集。究其背景,原來(lái)"KNI"指令集是Intel公司最 早為其下一代芯片命名的指令集名稱(chēng),而所謂的"MMX2"則完全是硬件評(píng)論家們和媒體憑感覺(jué)和印象對(duì)"KNI"的評(píng)價(jià),Intel公司從未正式發(fā)布過(guò)關(guān)于 MMX2的消息。

  而最終推出的SSE指令集也就是所謂勝出的"互聯(lián)網(wǎng)SSE"指令集。SSE指令集包括了70條指令,其中包含提高 3D圖形運(yùn)算效率的50條SIMD(單指令多數(shù)據(jù)技術(shù))浮點(diǎn)運(yùn)算指令、12條MMX 整數(shù)運(yùn)算增強(qiáng)指令、8條優(yōu)化內(nèi)存中連續(xù)數(shù)據(jù)塊傳輸指令。理論上這些指 令對(duì)目前流行的圖像處理、浮點(diǎn)運(yùn)算、3D運(yùn)算、視頻處理、音頻處理等諸多多媒體應(yīng)用起到全面強(qiáng)化的作用。SSE指令與3DNow!指令彼此互不兼容,但 SSE包含了3DNow!技術(shù)的絕大部分功能,只是實(shí)現(xiàn)的方法不同。SSE兼容MMX指令,它可以通過(guò)SIMD和單時(shí)鐘周期并行處理多個(gè)浮點(diǎn)數(shù)據(jù)來(lái)有效地 提高浮點(diǎn)運(yùn)算速度。

SSE2指令集
   SSE2(Streaming SIMD Extensions 2,Intel官方稱(chēng) 為SIMD 流技術(shù)擴(kuò)展 2或數(shù)據(jù)流單指令多數(shù)據(jù)擴(kuò)展指令集 2)指令集是Intel公司在SSE指令集的基礎(chǔ)上發(fā)展起來(lái)的。相比于SSE,SSE2使用 了144個(gè)新增指令,擴(kuò)展了MMX技術(shù)和SSE技術(shù),這些指令提高了廣大應(yīng)用程序的運(yùn)行性能。隨MMX技術(shù)引進(jìn)的SIMD整數(shù)指令從64位擴(kuò)展到了 128 位,使SIMD整數(shù)類(lèi)型操作的有效執(zhí)行率成倍提高。雙倍精度浮點(diǎn)SIMD指令允許以 SIMD格式同時(shí)執(zhí)行兩個(gè)浮點(diǎn)操作,提供雙倍精度操作支持有 助于加速內(nèi)容創(chuàng)建、財(cái)務(wù)、工程和科學(xué)應(yīng)用。除SSE2指令之外,最初的SSE指令也得到增強(qiáng),通過(guò)支持多種數(shù)據(jù)類(lèi)型(例如,雙字和四字)的算術(shù)運(yùn)算,支持 靈活并且動(dòng)態(tài)范圍更廣的計(jì)算功能。SSE2指令可讓軟件開(kāi)發(fā)員極其靈活的實(shí)施算法,并在運(yùn)行諸如MPEG-2、MP3、3D圖形等之類(lèi)的軟件時(shí)增強(qiáng)性能。 Intel是從Willamette核心的Pentium 4開(kāi)始支持SSE2指令集的,而AMD則是從K8架構(gòu)的SledgeHammer核心的 Opteron開(kāi)始才支持SSE2指令集的。

SSE3指令集
    SSE3(Streaming SIMD Extensions 3,Intel 官方稱(chēng)為SIMD 流技術(shù)擴(kuò)展 3或數(shù)據(jù)流單指令多數(shù)據(jù)擴(kuò)展指令集 3)指令集是Intel公司在SSE2指令集的基礎(chǔ)上發(fā)展起來(lái)的。相比于 SSE2,SSE3在SSE2的基礎(chǔ)上又增加了13個(gè)額外的SIMD指令。 SSE3 中13個(gè)新指令的主要目的是改進(jìn)線程同步和特定應(yīng)用程序領(lǐng)域,例如 媒體和游戲。這些新增指令強(qiáng)化了處理器在浮點(diǎn)轉(zhuǎn)換至整數(shù)、復(fù)雜算法、視頻編碼、SIMD浮點(diǎn)寄存器操作以及線程同步等五個(gè)方面的表現(xiàn),最終達(dá)到提升多媒體 和游戲性能的目的。Intel是從Prescott核心的Pentium 4開(kāi)始支持SSE3指令集的,而AMD則是從2005年下半年Troy核心的 Opteron開(kāi)始才支持SSE3的。但是需要注意的是,AMD所支持的 SSE3與Intel的SSE3并不完全相同,主要是刪除了針對(duì)Intel超線 程技術(shù)優(yōu)化的部分指令。

3D Now!(3D no waiting)指令集
  3DNow!是AMD公司開(kāi)發(fā)的SIMD指令集,可以增強(qiáng)浮點(diǎn)和多媒體運(yùn)算的速度,并被AMD廣泛應(yīng)用于其K6-2 、K6-3以及Athlon(K7)處理器上。3DNow!指令集技術(shù)其實(shí)就是21條機(jī)器碼的擴(kuò)展指令集。

   與Intel公司的MMX技術(shù)側(cè)重于整數(shù)運(yùn)算有所不同,3DNow!指令集主要針對(duì)三維建模、坐標(biāo)變換和效果渲染等三維應(yīng)用場(chǎng)合,在軟件的配合下,可以 大幅度提高3D處理性能。后來(lái)在Athlon上開(kāi)發(fā)了Enhanced 3DNow!。這些AMD標(biāo)準(zhǔn)的SIMD指令和Intel的SSE具有相同效能。 因?yàn)槭艿絀ntel在商業(yè)上以及Pentium III成功的影響,軟件在支持SSE上比起3DNow!更為普遍。Enhanced 3DNow!AMD 公司繼續(xù)增加至52個(gè)指令,包含了一些SSE碼,因而在針對(duì)SSE做最佳化的軟件中能獲得更好的效能。

--------------------------------------------------

CPU前端總線的公式、INTEL和AMD前端總線公式

前端總線(FSB)頻率(即總線頻率)是直接影響CPU與內(nèi)存直接數(shù)據(jù)交換速度
CPU主頻=總線頻率*倍頻
FSB(前端總線)front side bus
在PC 內(nèi)部,一個(gè)設(shè)備與另一個(gè)設(shè)備通過(guò)系統(tǒng)總線(Bus)傳遞數(shù)字信號(hào)。CPU可以通過(guò)前端總線(FSB)與內(nèi)存、顯卡及其他設(shè)備通信。FSB頻率越快,處理器在單位時(shí)間里得到更多的數(shù)據(jù),處理器利用率越高。
前端總線頻率直接影響CPU與內(nèi)存直接數(shù)據(jù)交換的總線速度。由于采用了特殊的技術(shù),使存在于CPU與內(nèi)存(CPU通過(guò)北橋的內(nèi)存管理器與內(nèi)存交換數(shù)據(jù))的總線能夠在一個(gè)時(shí)鐘周期內(nèi)完成2次甚至4次傳輸,因此相當(dāng)于頻率提升了好幾倍。(即是CPU外頻數(shù)倍。)

Intel和AMD在FSB上采用的技術(shù)不同。
Intel FSB頻率=CPU 外頻*4
例如:2.4C 外頻200MHz, FSB頻率800MHz
AMD FSB頻率=CPU外頻*2
例如:Athlon XP 2500+ (Barton)外頻 166MHz,F(xiàn)SB頻率333MHz 。

FSB帶寬表示FSB的數(shù)據(jù)傳輸速度,單位MB/s或GB/s 。
FSB帶寬=FSB頻率*FSB位寬/8,現(xiàn)在FSB位寬都是64位。
例如:P4 2.0A:FSB帶寬=400MHz*64bit/8=3.2GB/s 。

一般就INTEL的U來(lái)說(shuō)400的上266
533的上333技術(shù)不同。
Intel FSB頻率=CPU 外頻*4
例如:2.4C 外頻200MHz, FSB頻率800MHz
AMD FSB頻率=CPU外頻*2
例如:Athlon XP 2500+ (Barton)外頻 166MHz,F(xiàn)SB頻率333MHz 。

FSB帶寬表示FSB的數(shù)據(jù)傳輸速度,單位MB/s或GB/s 。
FSB帶寬=FSB頻率*FSB位寬/8,現(xiàn)在FSB位寬都是64位。
例如:P4 2.0A:FSB帶寬=400MHz*64bit/8=3.2GB/s 。

--------------------------------------------------

外頻、FSB和HT總線的三角關(guān)系

談 到CPU和主板的搭配,總是離不開(kāi)外頻、FSB和HT總線這三個(gè)名詞。在AMD的K8推出之前,F(xiàn)SB和外頻的關(guān)系算是比較清楚的。對(duì)于Intel的 CPU而言,F(xiàn)SB=外頻×4,如果是AMD的K7處理器,F(xiàn)SB=外頻×2。但是AMD K8的出現(xiàn)引入了全新的HT總線,使得三者的概念變得混淆起 來(lái)。兩年過(guò)去了,許多廠商和媒體的錯(cuò)誤宣傳使它們的關(guān)系變得更加復(fù)雜?!斑@款K8主板支持1000MHz FSB”這樣不負(fù)責(zé)任的說(shuō)法隨處可見(jiàn)。要徹底澄 清這個(gè)問(wèn)題,還是重新認(rèn)識(shí)一下外頻、FSB和HT的概念吧。 

    外頻,它指的是CPU和主板之間同步運(yùn)行的速度,是建立在數(shù)字脈沖 信號(hào)震蕩速度基礎(chǔ)之上的,也就是說(shuō),100MHz外頻特指數(shù)字脈沖信號(hào)每秒鐘發(fā)生一萬(wàn)萬(wàn)次的震蕩。說(shuō)到外頻,就必須提到兩個(gè)概念:倍頻與主頻。主頻是 CPU的時(shí)鐘頻率,倍頻即主頻與外頻之比的倍數(shù)。主頻/外頻/倍頻,其關(guān)系式為主頻=外頻×倍頻。 

    FSB,其全稱(chēng) Front Side Bus,中文名為前端總線。它是將CPU和北橋芯片的連接起來(lái)的總線,電腦的前端總線頻率是由CPU和北橋芯片共同決定的。曾幾何 時(shí),F(xiàn)SB也和外頻混為一談,這是因?yàn)樵谠缙冢绕涫荘entium 4出現(xiàn)之前,前端總線與外頻在頻率上是相等的,因此往往直接稱(chēng)前端總線為外頻。隨著 技術(shù)的發(fā)展,出現(xiàn)了QDR技術(shù),它們使得前端總線的頻率成為外頻的兩倍或者是四倍,所有才有了PentiumD 820外頻為200MHz,前端總線為 800MHz的說(shuō)法。

    AMD的K8處理器可說(shuō)是劃時(shí)代的,它把內(nèi)存控制器集成在了CPU里面,進(jìn)一步降低了延遲,而且全面引入了 HT(HyperTransport)總線的概念。這是一種高速點(diǎn)對(duì)點(diǎn)總線技術(shù),在K8平臺(tái)上起到傳輸CPU和主板芯片組之間數(shù)據(jù)的作用。K8和以往的處 理器最大的區(qū)別在于:由于CPU已不通過(guò)傳統(tǒng)的前端總線而是直接從內(nèi)存獲得數(shù)據(jù),在AMD發(fā)布的Athlon64 CPU規(guī)格表以及各個(gè)芯片組廠商發(fā)布的 芯片組原理圖上,前端總線這個(gè)名詞消失了,取而代之的是HT。
 
    它和FSB到底有什么具體的區(qū)別呢?首先,F(xiàn)SB和外頻是密不可 分的,外頻提高之后,F(xiàn)SB會(huì)隨之提高,這是不可調(diào)的。但是K8平臺(tái)的超頻就不一樣,當(dāng)提高CPU的外頻時(shí),往往要將HT的倍數(shù)往下調(diào)!用 AM2 Athlon64 3000+來(lái)打個(gè)比方,其默認(rèn)外頻是200MHz,假設(shè)主板支持1000MHz的HT總線,外頻由200MHz超到 250MHz時(shí)最好把HT的倍數(shù)從5調(diào)到4,使HT總線仍然保持在1000MHz上,這樣可以提高超頻的成功率。

----

關(guān)于顯卡

顯示芯片 
顯示芯片,又稱(chēng)圖型處理器 - GPU,它在顯卡中的作用,就如同CPU在電腦中的作用一樣。更直接的比喻就是大腦在人身體里的作用。 
先簡(jiǎn)要介紹一下常見(jiàn)的生產(chǎn)顯示芯片的廠商:Intel、ATI、nVidia、VIA(S3)、SIS、Matrox、3D Labs。 
Intel、VIA(S3)、SIS 主要生產(chǎn)集成芯片; 
ATI、nVidia 以獨(dú)立芯片為主,是目前市場(chǎng)上的主流,但由于ATi現(xiàn)在已經(jīng)被AMD收購(gòu),以后是否會(huì)繼續(xù)出獨(dú)立顯示芯片很難說(shuō)了; 
Matrox、3D Labs 則主要面向?qū)I(yè)圖形市場(chǎng)。 
由于ATI和nVidia基本占據(jù)了主流顯卡市場(chǎng),下面主要將主要針對(duì)這兩家公司的產(chǎn)品做介紹。 

型號(hào) 
ATi公司的主要品牌 Radeon(鐳) 系列,其型號(hào)由早其的 Radeon Xpress 200 到 Radeon (X300、X550、X600、X700、X800、X850) 到近期的 
Radeon (X1300、X1600、X1800、X1900、X1950) 性能依次由低到高。 
nVIDIA公司的主要品牌 GeForce 系列,其型號(hào)由早其的 GeForce 256、GeForce2 (100/200/400)、GeForce3(200/500)、GeForce4 
(420/440/460/4000/4200/4400/4600/4800) 到 GeForce FX(5200/5500/5600/5700/5800/5900/5950)、GeForce 
(6100/6150/6200/6400/6500/6600/6800/) 再到近其的 GeForce (7300/7600/7800/7900/7950) 性能依次由低到高。 

版本級(jí)別 
除了上述標(biāo)準(zhǔn)版本之外,還有些特殊版,特殊版一般會(huì)在標(biāo)準(zhǔn)版的型號(hào)后面加個(gè)后綴,常見(jiàn)的有: 
ATi: 
SE (Simplify Edition 簡(jiǎn)化版) 通常只有64bit內(nèi)存界面,或者是像素流水線數(shù)量減少。 
Pro (Professional Edition 專(zhuān)業(yè)版) 高頻版,一般比標(biāo)版在管線數(shù)量/頂點(diǎn)數(shù)量還有頻率這些方面都要稍微高一點(diǎn)。 
XT (eXTreme 高端版) 是ATi系列中高端的,而nVIDIA用作低端型號(hào)。 
XT PE (eXTreme Premium Edition XT白金版) 高端的型號(hào)。 
XL (eXtreme Limited 高端系列中的較低端型號(hào))ATI最新推出的R430中的高頻版 
XTX (XT eXtreme 高端版) X1000系列發(fā)布之后的新的命名規(guī)則。 
CE (Crossfire Edition 交叉火力版) 交叉火力。 
VIVO (VIDEO IN and VIDEO OUT) 指顯卡同時(shí)具備視頻輸入與視頻捕捉兩大功能。 
HM (Hyper Memory)可以占用內(nèi)存的顯卡 
nVIDIA: 
ZT 在XT基礎(chǔ)上再次降頻以降低價(jià)格。 
XT 降頻版,而在ATi中表示最高端。 
LE (Lower Edition 低端版) 和XT基本一樣,ATi也用過(guò)。 
MX 平價(jià)版,大眾類(lèi)。 
GTS/GS 低頻版。 
GE 比GS稍強(qiáng)點(diǎn),其實(shí)就是超了頻的GS。 
GT 高頻版。比GS高一個(gè)檔次 因?yàn)镚T沒(méi)有縮減管線和頂點(diǎn)單元。 
GTO 比GT稍強(qiáng)點(diǎn),有點(diǎn)汽車(chē)中GTO的味道。 
Ultra 在GF7系列之前代表著最高端,但7系列最高端的命名就改為GTX 。 
GTX (GT eXtreme)加強(qiáng)版,降頻或者縮減流水管道后成為GT,再繼續(xù)縮水成為GS版本。 
GT2 雙GPU顯卡。 
TI (Titanium 鈦) 一般就是代表了nVidia的高端版本。 
Go 多用語(yǔ)移動(dòng)平臺(tái)。 
TC (Turbo Cache)可以占用內(nèi)存的顯卡 
開(kāi)發(fā)代號(hào) 
所 謂開(kāi)發(fā)代號(hào)就是顯示芯片制造商為了便于顯示芯片在設(shè)計(jì)、生產(chǎn)、銷(xiāo)售方面的管理和驅(qū)動(dòng)架構(gòu)的統(tǒng)一而對(duì)一個(gè)系列的顯示芯片給出的相應(yīng)的基本的代號(hào)。開(kāi)發(fā)代號(hào)作 用是降低顯示芯片制造商的成本、豐富產(chǎn)品線以及實(shí)現(xiàn)驅(qū)動(dòng)程序的統(tǒng)一。一般來(lái)說(shuō),顯示芯片制造商可以利用一個(gè)基本開(kāi)發(fā)代號(hào)再通過(guò)控制渲染管線數(shù)量、頂點(diǎn)著色 單元數(shù)量、顯存類(lèi)型、顯存位寬、核心和顯存頻率、所支持的技術(shù)特性等方面來(lái)衍生出一系列的顯示芯片來(lái)滿足不同的性能、價(jià)格、市場(chǎng)等不同的定位,還可以把制 造過(guò)程中具有部分瑕疵的高端顯示芯片產(chǎn)品通過(guò)屏蔽管線等方法處理成為完全合格的相應(yīng)低端的顯示芯片產(chǎn)品出售,從而大幅度降低設(shè)計(jì)和制造的難度和成本,豐富 自己的產(chǎn)品線。同一種開(kāi)發(fā)代號(hào)的顯示芯片可以使用相同的驅(qū)動(dòng)程序,這為顯示芯片制造商編寫(xiě)驅(qū)動(dòng)程序以及消費(fèi)者使用顯卡都提供了方便。 
同一種開(kāi)發(fā) 代號(hào)的顯示芯片的渲染架構(gòu)以及所支持的技術(shù)特性是基本上相同的,而且所采用的制程也相同,所以開(kāi)發(fā)代號(hào)是判斷顯卡性能和檔次的重要參數(shù)。同一類(lèi)型號(hào)的不同 版本可以是一個(gè)代號(hào),例如:GeForce (X700、X700 Pro、X700 XT) 代號(hào)都是 RV410;而Radeon (X1900、 X1900XT、X1900XTX) 代號(hào)都是 R580 等,但也有其他的情況,如:GeForce (7300 LE、7300 GS) 代號(hào) 是 G72 ;而 GeForce (7300 GT、7600 GS、7600 GT) 代號(hào)都是 G73 等。 

制造工藝 
制 造工藝指得是在生產(chǎn)GPU過(guò)程中,要進(jìn)行加工各種電路和電子元件,制造導(dǎo)線連接各個(gè)元器件。通常其生產(chǎn)的精度以u(píng)m(微米)來(lái)表示,未來(lái)有向nm(納米) 發(fā)展的趨勢(shì)(1mm=1000um 1um=1000nm),精度越高,生產(chǎn)工藝越先進(jìn)。在同樣的材料中可以制造更多的電子元件,連接線也越細(xì),提高芯片 的集成度,芯片的功耗也越小。 
制造工藝的微米是指IC內(nèi)電路與電路之間的距離。制造工藝的趨勢(shì)是向密集度愈高的方向發(fā)展。密度愈高的IC電路設(shè) 計(jì),意味著在同樣大小面積的IC中,可以擁有密度更高、功能更復(fù)雜的電路設(shè)計(jì)。微電子技術(shù)的發(fā)展與進(jìn)步,主要是靠工藝技術(shù)的不斷改進(jìn),使得器件的特征尺寸 不斷縮小,從而集成度不斷提高,功耗降低,器件性能得到提高。芯片制造工藝在1995年以后,從0.5微米、0.35微米、0.25微米、0.18微米、 0.15微米、0.13微米,再到目前主流的 90 納米(0.09納米) 、65 納米等。 
核心頻率 
顯卡的核心頻率是指顯示核心的 工作頻率,其工作頻率在一定程度上可以反映出顯示核心的性能,但顯卡的性能是由核心頻率、顯存、像素管線、像素填充率等等多方面的情況所決定的,因此在顯 示核心不同的情況下,核心頻率高并不代表此顯卡性能強(qiáng)勁。比如9600PRO的核心頻率達(dá)到了400MHz,要比9800PRO的380MHz高,但在性 能上9800PRO絕對(duì)要強(qiáng)于9600PRO。在同樣級(jí)別的芯片中,核心頻率高的則性能要強(qiáng)一些,提高核心頻率就是顯卡超頻的方法之一。顯示芯片主流的只 有ATI和NVIDIA兩家,兩家都提供顯示核心給第三方的廠商,在同樣的顯示核心下,部分廠商會(huì)適當(dāng)提高其產(chǎn)品的顯示核心頻率,使其工作在高于顯示核心 固定的頻率上以達(dá)到更高的性能。 

2、顯存 

類(lèi)型 
目前市場(chǎng)中所采用的顯存類(lèi)型主要有SDRAM,DDR SDRAM,DDR SGRAM三種。 
SDRAM顆粒目前主要應(yīng)用在低端顯卡上,頻率一般不超過(guò)200MHz,在價(jià)格和性能上它比DDR都沒(méi)有什么優(yōu)勢(shì),因此逐漸被DDR取代。 
DDR SDRAM 是Double Data Rate SDRAM的縮寫(xiě)(雙倍數(shù)據(jù)速率) ,它能提供較高的工作頻率,帶來(lái)優(yōu)異的數(shù)據(jù)處理性能。 
DDR SGRAM 是 顯卡廠商特別針對(duì)繪圖者需求,為了加強(qiáng)圖形的存取處理以及繪圖控制效率,從同步動(dòng)態(tài)隨機(jī)存取內(nèi)存(SDRAM)所改良而得的產(chǎn)品。SGRAM允許以方 塊 (Blocks) 為單位個(gè)別修改或者存取內(nèi)存中的資料,它能夠與中央處理器(CPU)同步工作,可以減少內(nèi)存讀取次數(shù),增加繪圖控制器的效率,盡管 它穩(wěn)定性不錯(cuò),而且性能表現(xiàn)也很好,但是它的超頻性能很差。 
目前市場(chǎng)上的主流是DDR2和DDR3,。 
位寬 
顯存位寬是顯存 在一個(gè)時(shí)鐘周期內(nèi)所能傳送數(shù)據(jù)的位數(shù),位數(shù)越大則瞬間所能傳輸?shù)臄?shù)據(jù)量越大,這是顯存的重要參數(shù)之一。目前市場(chǎng)上的顯存位寬有64位、128位、256位 和512位幾種,人們習(xí)慣上叫的64位顯卡、128位顯卡和256位顯卡就是指其相應(yīng)的顯存位寬。顯存位寬越高,性能越好價(jià)格也就越高,因此512位寬的 顯存更多應(yīng)用于高端顯卡,而主流顯卡基本都采用128和256位顯存。 
顯存帶寬=顯存頻率X顯存位寬/8,在顯存頻率相當(dāng)?shù)那闆r下,顯存位寬將 決定顯存帶寬的大小。例如:同樣顯存頻率為500MHz的128位和256位顯存,那么它倆的顯存帶寬將分別為:128 位=500MHz*128∕8=8GB/s,而256位=500MHz*256∕8=16GB/s,是128位的2倍,可見(jiàn)顯存位寬在顯存數(shù)據(jù)中的重要 性。顯卡的顯存是由一塊塊的顯存芯片構(gòu)成的,顯存總位寬同樣也是由顯存顆粒的位寬組成。顯存位寬=顯存顆粒位寬×顯存顆粒數(shù)。顯存顆粒上都帶有相關(guān)廠家的 內(nèi)存編號(hào),可以去網(wǎng)上查找其編號(hào),就能了解其位寬,再乘以顯存顆粒數(shù),就能得到顯卡的位寬。 
容量 
這個(gè)就比較好理解了,容量越大,存的東西就越多,當(dāng)然也就越好。 
目前主流的顯存容量,64MB、128MB、256MB、512MB等。 
封裝類(lèi)型 
顯存封裝形式主要有: 
TSOP (Thin Small Out-Line Package) 薄型小尺寸封裝 
QFP (Quad Flat Package) 小型方塊平面封裝 
MicroBGA (Micro Ball Grid Array) 微型球閘陣列封裝,又稱(chēng)FBGA(Fine-pitch Ball Grid Array) 
目前的主流顯卡基本上是用TSOP和MBGA封裝,其中又以TSOP封裝居多. 
速度 
顯存速度一般以ns(納秒)為單位。常見(jiàn)的顯存速度有7ns、6ns、5.5ns、5ns、4ns,3.6ns、2.8ns、2.2ns、1.1ns等,越小表示速度越快\越好。 
顯存的理論工作頻率計(jì)算公式是:額定工作頻率(MHz)=1000/顯存速度×n得到(n因顯存類(lèi)型不同而不同,如果是SDRAM顯存,則n=1;DDR顯存則n=2;DDRII顯存則n=4)。 
頻率 
顯存頻率一定程度上反應(yīng)著該顯存的速度,以MHz(兆赫茲)為單位。 
顯存頻率隨著顯存的類(lèi)型、性能的不同而不同: 
SDRAM顯存一般都工作在較低的頻率上,一般就是133MHz和166MHz,此種頻率早已無(wú)法滿足現(xiàn)在顯卡的需求。 
DDR SDRAM 顯存則能提供較高的顯存頻率,因此是目前采用最為廣泛的顯存類(lèi)型,目前無(wú)論中、低端顯卡,還是高端顯卡大部分都采用DDR SDRAM,其所能提供的顯存 頻率也差異很大,主要有400MHz、500MHz、600MHz、650MHz等,高端產(chǎn)品中還有800MHz或900MHz,乃至更高。 
顯 存頻率與顯存時(shí)鐘周期是相關(guān)的,二者成倒數(shù)關(guān)系,也就是顯存頻率=1/顯存時(shí)鐘周期。如果是SDRAM顯存,其時(shí)鐘周期為6ns,那么它的顯存頻率就為1 /6ns=166 MHz;而對(duì)于DDR SDRAM,其時(shí)鐘周期為6ns,那么它的顯存頻率就為1/6ns=166 MHz,但要了解的是這是 DDR SDRAM的實(shí)際頻率,而不是我們平時(shí)所說(shuō)的DDR顯存頻率。因?yàn)镈DR在時(shí)鐘上升期和下降期都進(jìn)行數(shù)據(jù)傳輸,其一個(gè)周期傳輸兩次數(shù)據(jù),相當(dāng)于 SDRAM頻率的二倍。習(xí)慣上稱(chēng)呼的DDR頻率是其等效頻率,是在其實(shí)際工作頻率上乘以2,就得到了等效頻率。因此6ns的DDR顯存,其顯存頻率為 1/6ns*2=333 MHz。但要明白的是顯卡制造時(shí),廠商設(shè)定了顯存實(shí)際工作頻率,而實(shí)際工作頻率不一定等于顯存最大頻率。此類(lèi)情況現(xiàn)在較為常見(jiàn), 如顯存最大能工作在650 MHz,而制造時(shí)顯卡工作頻率被設(shè)定為550 MHz,此時(shí)顯存就存在一定的超頻空間。這也就是目前廠商慣用的方法,顯卡以超 頻為賣(mài)點(diǎn)。 

3、技術(shù) 
象素渲染管線 
渲染管線也稱(chēng)為渲染流水線,是顯示芯片內(nèi)部處理圖形信號(hào)相互獨(dú)立的的并行處理單元。 
在 某種程度上可以把渲染管線比喻為工廠里面常見(jiàn)的各種生產(chǎn)流水線,工廠里的生產(chǎn)流水線是為了提高產(chǎn)品的生產(chǎn)能力和效率,而渲染管線則是提高顯卡的工作能力和 效率。 渲染管線的數(shù)量一般是以 像素渲染流水線的數(shù)量×每管線的紋理單元數(shù)量 來(lái)表示。例如,GeForce 6800Ultra的渲染管線是 16×1,就表示其具有16條像素渲染流水線,每管線具有1個(gè)紋理單元;GeForce4 MX440的渲染管線是2×2,就表示其具有2條像素渲染流水 線,每管線具有2個(gè)紋理單元等等,其余表示方式以此類(lèi)推。 渲染管線的數(shù)量是決定顯示芯片性能和檔次的最重要的參數(shù)之一,在相同的顯卡核心頻率下,更多的 渲染管線也就意味著更大的像素填充率和紋理填充率,從顯卡的渲染管線數(shù)量上可以大致判斷出顯卡的性能高低檔次。但顯卡性能并不僅僅只是取決于渲染管線的數(shù) 量,同時(shí)還取決于顯示核心架構(gòu)、渲染管線的的執(zhí)行效率、頂點(diǎn)著色單元的數(shù)量以及顯卡的核心頻率和顯存頻率等等方面。 
一般來(lái)說(shuō)在相同的顯示核心架 構(gòu)下,渲染管線越多也就意味著性能越高,例如16×1架構(gòu)的GeForce 6800GT其性能要強(qiáng)于12×1架構(gòu)的GeForce 6800,就象工廠 里的采用相同技術(shù)的2條生產(chǎn)流水線的生產(chǎn)能力和效率要強(qiáng)于1條生產(chǎn)流水線那樣;而在不同的顯示核心架構(gòu)下,渲染管線的數(shù)量多就并不意味著性能更好,例如 4×2架構(gòu)的GeForce2 GTS其性能就不如2×2架構(gòu)的GeForce4 MX440,就象工廠里的采用了先進(jìn)技術(shù)的1條流水線的生產(chǎn)能力和效率 反而還要強(qiáng)于只采用了老技術(shù)的2條生產(chǎn)流水線那樣。 

頂點(diǎn)著色引擎數(shù) 
頂點(diǎn)著色引擎(Vertex Shader),也稱(chēng)為頂點(diǎn)遮蔽器,根據(jù)官方規(guī)格,頂點(diǎn)著色引擎是一種增加各式特效在3D場(chǎng)影中的處理單元,頂點(diǎn)著色引擎 
的可程式化特性允許開(kāi)發(fā)者靠加載新的軟件指令來(lái)調(diào)整各式的特效,每一個(gè)頂點(diǎn)將被各種的數(shù)據(jù)變素清楚地定義,至少包括每一頂點(diǎn)的x、y、z坐標(biāo),每一點(diǎn)頂點(diǎn)可能包函的數(shù)據(jù)有顏色、最初的徑路、材質(zhì)、光線特征等。頂點(diǎn)著色引擎數(shù)越多速度越快。 
3D API 
API是Application Programming Interface的縮寫(xiě),是應(yīng)用程序接口的意思,而3D API則是指顯卡與應(yīng)用程序直接的接口。 
3D API 能讓編程人員所設(shè)計(jì)的3D軟件只要調(diào)用其API內(nèi)的程序,從而讓API自動(dòng)和硬件的驅(qū)動(dòng)程序溝通,啟動(dòng)3D芯片內(nèi)強(qiáng)大的3D圖形處理功能,從而大幅度地提 高了3D程序的設(shè)計(jì)效率。如果沒(méi)有3D API在開(kāi)發(fā)程序時(shí),程序員必須要了解全部的顯卡特性,才能編寫(xiě)出與顯卡完全匹配的程序,發(fā)揮出全部的顯卡性能。 而有了3D API這個(gè)顯卡與軟件直接的接口,程序員只需要編寫(xiě)符合接口的程序代碼,就可以充分發(fā)揮顯卡的不必再去了解硬件的具體性能和參數(shù),這樣就大大 簡(jiǎn)化了程序開(kāi)發(fā)的效率。同樣,顯示芯片廠商根據(jù)標(biāo)準(zhǔn)來(lái)設(shè)計(jì)自己的硬件產(chǎn)品,以達(dá)到在API調(diào)用硬件資源時(shí)最優(yōu)化,獲得更好的性能。有了3D API,便可 實(shí)現(xiàn)不同廠家的硬件、軟件最大范圍兼容。比如在最能體現(xiàn)3D API的游戲方面,游戲設(shè)計(jì)人員設(shè)計(jì)時(shí),不必去考慮具體某款顯卡的特性,而只是按照 3D API的接口標(biāo)準(zhǔn)來(lái)開(kāi)發(fā)游戲,當(dāng)游戲運(yùn)行時(shí)則直接通過(guò)3D API來(lái)調(diào)用顯卡的硬件資源。 
目前個(gè)人電腦中主要應(yīng)用的3D API有:DirectX和OpenGL。 
RAMDAC頻率和支持最大分辨率 
RAMDAC是Random Access Memory Digital/Analog Convertor的縮寫(xiě),即隨機(jī)存取內(nèi)存數(shù)字~模擬轉(zhuǎn)換器。 
RAMDAC 作用是將顯存中的數(shù)字信號(hào)轉(zhuǎn)換為顯示器能夠顯示出來(lái)的模擬信號(hào),其轉(zhuǎn)換速率以MHz表示。計(jì)算機(jī)中處理數(shù)據(jù)的過(guò)程其實(shí)就是將事物數(shù)字化的過(guò)程,所有的事物 將被處理成0和1兩個(gè)數(shù),而后不斷進(jìn)行累加計(jì)算。圖形加速卡也是靠這些0和1對(duì)每一個(gè)象素進(jìn)行顏色、深度、亮度等各種處理。顯卡生成的都是信號(hào)都是以數(shù)字 來(lái)表示的,但是所有的CRT顯示器都是以模擬方式進(jìn)行工作的,數(shù)字信號(hào)無(wú)法被識(shí)別,這就必須有相應(yīng)的設(shè)備將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。而RAMDAC就是顯 卡中將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)的設(shè)備。RAMDAC的轉(zhuǎn)換速率以MHz表示,它決定了刷新頻率的高低(與顯示器的“帶寬”意義近似)。其工作速度越高,頻 帶越寬,高分辨率時(shí)的畫(huà)面質(zhì)量越好.該數(shù)值決定了在足夠的顯存下,顯卡最高支持的分辨率和刷新率。如果要在1024×768的分辨率下達(dá)到85Hz的分辨 率,RAMDAC的速率至少是1024×768×85×1.344(折算系數(shù))÷106≈90MHz。目前主流的顯卡RAMDAC都能達(dá)到350MHz和 400MHz,已足以滿足和超過(guò)目前大多數(shù)顯示器所能提供的分辨率和刷新率。 
4、PCB板 
PCB是Printed Circuit Block的縮寫(xiě),也稱(chēng)為印制電路板。就是顯卡的軀體(綠色的板子),顯卡一切元器件都是放在PCB板上的,因此PCB板的好壞,直接決定著顯卡電氣性能的好壞和穩(wěn)定。 
層數(shù) 
目前的PCB板一般都是采用4層、6層、或8層,理論上來(lái)說(shuō)層數(shù)多的比少的好,但前提是在設(shè)計(jì)合理的基礎(chǔ)上。 
PCB 的各個(gè)層一般可分為信號(hào)層(Signal),電源層(Power)或是地線層(Ground)。每一層PCB版上的電路是相互獨(dú)立的。在4層PCB的主板 中,信號(hào)層一般分布在PCB的最上面一層和最下面一層,而中間兩層則是電源與地線層。相對(duì)來(lái)說(shuō)6層PCB就復(fù)雜了,其信號(hào)層一般分布在1、3、5層,而電 源層則有2層。至于判斷PCB的優(yōu)劣,主要是觀察其印刷電路部分是否清晰明了,PCB是否平整無(wú)變形等等。 
顯卡接口 
常見(jiàn)的有PCI、AGP 2X/4X/8X (目前已經(jīng)淘汰),最新的是PCI-Express X16接口,是目前的主流。 

輸出接口 
現(xiàn)在最常見(jiàn)的輸出接口主要有: 
VGA (Video Graphics Array) 視頻圖形陣列接口,作用是將轉(zhuǎn)換好的模擬信號(hào)輸出到CRT或者LCD顯示器中 
DVI (Digital Visual Interface) 數(shù)字視頻接口接口,視頻信號(hào)無(wú)需轉(zhuǎn)換,信號(hào)無(wú)衰減或失真,未來(lái)VGA接口的替代者。 
S-Video (Separate Video) S端子,也叫二分量視頻接口,一般采用五線接頭,它是用來(lái)將亮度和色度分離輸出的設(shè)備,主要功能是為了克服 
視頻節(jié)目復(fù)合輸出時(shí)的亮度跟色度的互相干擾。 
散熱裝置 
散熱裝置的好壞也能影響到顯卡的運(yùn)行穩(wěn)定性,常見(jiàn)的散熱裝置有: 
被動(dòng)散熱:既只安裝了鋁合金或銅等金屬的散熱片。 
風(fēng)冷散熱:在散熱片上加裝了風(fēng)扇,目前多數(shù)采用這種方法。 
水冷散熱:通過(guò)熱管液體把GPU和水泵相連,一般在高端頂級(jí)顯卡中采用。 
顏色 
很多人認(rèn)為紅色顯卡的比綠色的好、綠色的比黃色的好,顯卡的好壞和其顏色并沒(méi)有什么關(guān)系,有的廠家喜用紅色,有的喜用綠色,這是完全由生產(chǎn)商決定的。一些名牌大廠,那是早就形成了一定的風(fēng)格的。因此,其PCB的顏色一般也不會(huì)有太大的變動(dòng)。 

5、品牌 
目前顯卡業(yè)的競(jìng)爭(zhēng)也是日趨激烈。各類(lèi)品牌名目繁多,以下是我自認(rèn)為一些比較不錯(cuò)的牌子,僅供參考請(qǐng)不要太迷信了: 
邁創(chuàng)(MATROX) 、3Dlabs 、藍(lán)寶石(SAPPHIRE) 、華碩(ASUS)、鴻海(Foxconn)、撼迅/迪蘭恒進(jìn)(PowerColor/Dataland)、麗臺(tái)(Leadtek)、訊景(XFX)、映眾(Inno3D) 

微 星(MSI)、艾爾莎(ELSA)、富彩(FORSA)、同德(Palit)、捷波(Jetway)、升技(Abit)、磐正(EPOX) 、映泰 (Biostar) 、耕升(Gainward)、旌宇(SPARKLE) 、影馳(GALAXY) 、天揚(yáng)(GRANDMARS) 、超卓天彩 (SuperGrece)、銘瑄(MAXSUN)、翔升(ASL)、盈通(YESTON)



顯卡三個(gè)重要指標(biāo):容量、頻率和顯存位寬。 

1.容量 

顯存擔(dān)負(fù)著系統(tǒng)與顯卡之間數(shù)據(jù)交換以及顯示芯片運(yùn)算3D圖形時(shí)的數(shù)據(jù)緩存,因此顯存容量自然決定了顯示芯片能處理的數(shù)據(jù)量。理論上講,顯存越大,顯卡性能就越好。不過(guò)這只是理論上的計(jì)算而已,實(shí)際顯卡性能要受到很多因素的約束,如:顯示芯片速度,顯存位寬、顯存速度等。 

2.時(shí)鐘周期和工作頻率 

時(shí) 鐘周期和顯存工作頻率是顯存非常重要的性能指標(biāo),它指的是顯存每處理一次數(shù)據(jù)要經(jīng)過(guò)的時(shí)間。顯存速度越快,單位時(shí)間交換的數(shù)據(jù)量也就越大,在同等情況下顯 卡性能將會(huì)得到明顯提升。顯存的時(shí)鐘周期一般以ns(納秒)為單位,工作頻率以MHz為單位。顯存時(shí)鐘周期跟工作頻率一一對(duì)應(yīng),它們之間的關(guān)系為:工作頻 率=1÷時(shí)鐘周期×1000。 

常見(jiàn)顯存時(shí)鐘周期有5ns、4ns、3.8ns、3.6ns、3.3ns、2.8ns。對(duì)于 DDR SDRAM顯存來(lái)說(shuō),描述其工作頻率時(shí)用的是等效工作頻率。因?yàn)槟茉跁r(shí)鐘周期的上升沿和下降沿都能傳送數(shù)據(jù),所以在工作頻率和數(shù)據(jù)位寬度相同的情 況下,顯存帶寬是SDRAM的兩倍。換句話說(shuō),在顯存時(shí)鐘周期相同的情況下,DDR SDRAM顯存的實(shí)際工作頻率是SDRAM顯存的兩倍。例如,5ns 的SDRAM顯存的工作頻率為200MHz,而5ns的DDR SDRAM顯存的等效工作頻率就是400MHz。目前市面上顯卡所采用的顯存都為 DDR,SDR已經(jīng)被淘汰了。 

3.顯存位寬 

顯存位寬是顯存也是顯卡的一個(gè)很重要的參數(shù)。可以理解成為數(shù)據(jù)進(jìn)出通道的 大小,顯然,在顯存速度(工作頻率)一樣的情況下,帶寬越大,數(shù)據(jù)的吞吐量可以越大,性能越好。就現(xiàn)在顯卡比較常見(jiàn)是64Bit和128Bit而言,很明 顯的,在頻率相同的情況下,128Bit顯存的數(shù)據(jù)吞量是64Bit的兩倍(實(shí)際使用中達(dá)不到),性能定會(huì)增強(qiáng)不少。 

顯存的三個(gè)主要參數(shù)已經(jīng)介紹完了,接下來(lái)讓我們看看這三個(gè)主要參數(shù)的計(jì)算公式: 

顯卡的內(nèi)存容量=單顆顯存顆粒的容量X 顯存顆粒數(shù)量 
顯卡的顯存位寬=單顆顯存位寬X 顯存顆粒數(shù)量 
顯卡的顯存工作頻率=單顆顯存顆粒的工作頻率 

知 道了顯存的位寬和速度,我們就可以知道顯存的帶寬了,帶寬=工作頻率×顯存位寬÷8,之所以要除以8,是因?yàn)槊?個(gè)bit(位)等于一個(gè)byte(字 節(jié))。帶寬是顯存速度的最終衡量,數(shù)據(jù)吞吐量的大小也就是顯存的速度就看帶寬了。有些顯卡的顯存頻率高,但是位寬低,帶寬不高;有些們寬高,但是頻率低, 帶寬也不高。 

因此,為了能準(zhǔn)確計(jì)算出一塊顯卡的顯存容量、速度、帶寬,我們必須從觀察一個(gè)顯存顆粒的大小以及數(shù)據(jù)位寬度開(kāi)始。每顆顯存顆粒上雖然沒(méi)有明確標(biāo)明以上所說(shuō)的三個(gè)參數(shù),但是它上面都印有編號(hào),我們想要知道的三個(gè)參數(shù)都可以從這個(gè)編號(hào)上讀出。


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多

    老司机激情五月天在线不卡| 免费在线播放一区二区| 久久亚洲国产视频三级黄| 日韩一本不卡在线观看| 蜜桃传媒视频麻豆第一区| 久久精品亚洲精品一区| 亚洲a码一区二区三区| 亚洲欧美中文日韩综合| 九九热国产这里只有精品| 国产一区二区精品丝袜| 国产亚洲午夜高清国产拍精品| 日韩精品视频香蕉视频| 中文字幕日产乱码一区二区| 国产一区二区在线免费| 人妻人妻人人妻人人澡| 亚洲中文字幕在线观看四区 | 亚洲欧美日韩精品永久| 中文字幕精品一区二区年下载| 欧美一区二区黑人在线| 亚洲一级在线免费观看| 亚洲精品中文字幕无限乱码| 福利专区 久久精品午夜| 久久91精品国产亚洲| 亚洲中文字幕一区三区| 国产高清在线不卡一区| 日本不卡在线视频你懂的| 色婷婷亚洲精品综合网| 婷婷一区二区三区四区| 激情五月激情婷婷丁香| 一区二区三区亚洲天堂| 激情丁香激情五月婷婷| 亚洲精品一二三区不卡| 东京热男人的天堂一二三区| 国产成人午夜av一区二区| 日韩一级欧美一级久久| 国内真实露脸偷拍视频| 欧美色婷婷综合狠狠爱| 亚洲性日韩精品一区二区| 日本高清不卡在线一区| 日韩偷拍精品一区二区三区| 欧美在线观看视频免费不卡|