對于Intel和AMD這樣的通用型處理器廠商而言,既要考慮臺式機、筆記本等個人用戶的市場需求,也需要考慮服務(wù)器市場的需求。因此,為了避免設(shè)計、生產(chǎn)和成本上的重復(fù),就有必要設(shè)計出一套“放之四海皆準(zhǔn)”的處理器微架構(gòu)。 AMD由K7向K8邁進(jìn),便是為了主攻服務(wù)器市場,K8放棄了K7的共享式前端總線架構(gòu),同時在繼承K7單核架構(gòu)的基礎(chǔ)上進(jìn)行了有力的內(nèi)部改良,獲得了不小的成功。然而K10由于在單核執(zhí)行效率上不思進(jìn)取,因此在單處理器市場被對手的Core微架構(gòu)打得節(jié)節(jié)敗退。而Intel的Core微架構(gòu)也并非無懈可擊,眾所周知,Core微架構(gòu)源于筆記本平臺,雖然單處理器效能強勁,同時又具備良好的省電性能,因此受到單機和筆記本用戶的青睞。但由于一直采用老舊的前端總線來連接多處理器,因此在以多處理器為主要訴求的服務(wù)器市場就顯得有些被動。 為了改變這種狀況,重新在多處理器服務(wù)器市場上站穩(wěn)腳跟。Intel終于放棄了前端總線結(jié)構(gòu),拿出了新一代集成了內(nèi)存控制器和QPI點對點連接的微架構(gòu)。與此同時,為了兼顧到桌面與筆記本市場,Core i7(酷睿i7)也對微內(nèi)核內(nèi)部架構(gòu)進(jìn)行了增強和調(diào)整。而對超頻者而言,這些較大的改動,也使Core i7的超頻體驗變得與過去超頻酷睿2有很大的不同! 幸運的是,我們在Core i7正式發(fā)布不久,便拿到了一塊Core i7 EE 965處理器(至尊版)和Intel DX580SO主板。以下,便與大家共同體驗Core i7的風(fēng)采!文章共分為三個部分: 第一部分詳細(xì)地介紹了Core i7在系統(tǒng)架構(gòu)與內(nèi)部架構(gòu)上的變化; 第二部分則通過實際超頻,介紹了Core i7在超頻方法上的變化; 第三部分則測試了默認(rèn)狀態(tài)下的Core i7系統(tǒng)的性能。 本次測試得到Intel、ATi、金邦、宇瞻等硬件廠商人員的大力支持,本地商家方面,金邦售后服務(wù)中心、三靈電子、恒泰科技、敏威科技以及永嘉成科技等也給予熱情的支持,在此一并予以感謝! 過去,Intel處理器只能使用并行的前端總線通過北橋與外界交流,這種總線依然采用老舊的AGTL+信號技術(shù)。不但總線頻率難以提高,同時也容易在多處理器場合引起處理器—北橋—內(nèi)存的通路,由于信息傳輸過于繁忙而阻塞。更糟的是由于需要經(jīng)過北橋訪問內(nèi)存,因此內(nèi)存讀寫的延遲較大。 Core i7中則將處理器分為內(nèi)核外核兩部分,內(nèi)核部分包含執(zhí)行核心及其專屬的一級、二級緩存,外核部分則包含共享式三級緩存、集成的內(nèi)存控制器IMC、QPI接口以及功耗、頻率控制部分。集成的內(nèi)存控制器將直接與專署的內(nèi)存交換數(shù)據(jù),而由于北橋中不再含內(nèi)存控制器,所以原來MCH(Memory Control Hub)的名稱也改為IOH。而QPI接口則替代前端總線來與其它處理器和北橋進(jìn)行連接。 新集成的內(nèi)存控制器將支持最大三通道配置的DDR3內(nèi)存子系統(tǒng),顯著減小內(nèi)存?zhèn)鬏斞舆t,并且比原有的雙通道配置增加最大高達(dá)3倍的傳輸帶寬! 而另外一個接口:QPI傳輸帶寬方面,我們將Core i7的QPI與酷睿2的并行前端總線、以及K8、K10的Hyperstransport接口進(jìn)行了比較。 經(jīng)過這種設(shè)計,不但大大減小了內(nèi)存延遲,而且也充分緩解了多處理器場合下總線帶寬不足的情況。再配合高效執(zhí)行的內(nèi)核,不論對于桌面、服務(wù)器系統(tǒng),都有重大的意義。 同時,由于采用內(nèi)外核的模塊式設(shè)計,因此可伸縮性十足,可以根據(jù)需要增減QPI的數(shù)量,比如我們手上的這顆Bloomfield核心Core i7 EE-965便有1個QPI接口,而工作站、服務(wù)器領(lǐng)域的Bloomfield-EX核心則會有2個QPI接口。有關(guān)Core i7可能派生的各種型號,在我們以往的這篇《Nehalem規(guī)格總結(jié)與處理器實物展示》中,已經(jīng)對基于Nehalem的四種變型作了介紹,需要了解的朋友可以點擊鏈接查看。
加入共享式三級緩存 另外,與上一代處理器有明顯不同的地方,是在Core i7的緩存設(shè)計上。在上一代酷睿2處理器中,采用的是各個核心獨享一級緩存,共享二級緩存的設(shè)計方案。而在Core i7上則改變?yōu)橐?、二級緩存獨享,三級緩存共享的設(shè)計方案。
容量方面,獨享的一級指令、數(shù)據(jù)緩存仍與酷睿2一樣,為32/32 KB,讀寫延遲比酷睿2的3周期稍慢,約為4周期,不過Core i7更優(yōu)秀的內(nèi)存讀寫延遲可以較好地彌補;二級緩存部分,每個核心獨享256KB容量,讀寫延遲約12周期。三級緩存部分則為共享式,容量8MB,讀寫延遲約30-40周期。 雖然都使用了三級共享式緩存,但與AMD的K10有所不同的是,Core i7的三級緩存采用inclusive(內(nèi)含式)設(shè)計。也就是說在各個核心的一級、二級緩存中的數(shù)據(jù),在三級緩存中都會進(jìn)行保存。而AMD的K10則采用Mostly exclusive(非內(nèi)含式)設(shè)計,一級、二級緩存中的數(shù)據(jù)并不常在三級緩存中進(jìn)行備份。 以上是我們使用Everest對Core i7 EE-965所進(jìn)行的緩存-內(nèi)存子系統(tǒng)帶寬、延遲的測試,由測試結(jié)果可見,內(nèi)存部分的帶寬都得到顯著提升,延遲明顯地減少。 除了新的三級緩存之外,用于快速檢索內(nèi)存的TLB緩存部分也做了大量改良,如增加緩存容量、采取真正的兩級式結(jié)構(gòu),增加用于SMT技術(shù)的虛處理器ID標(biāo)志位等措施。充分保證增加了三級緩存,并采用SMT技術(shù)后仍能保證核心的高效運轉(zhuǎn)。
SMT技術(shù)重新回歸 在奔騰4時代,Intel便推出了超線程技術(shù),這項技術(shù)允許將一個真實處理器核心模擬為兩個虛擬核心,這樣在理想的條件下,處理互不沖突的多線程任務(wù)時,便能充分利用每個核心中的空閑執(zhí)行單元。 但是在酷睿核心中,Intel并沒有繼續(xù)采用這項技術(shù)。如今發(fā)展到Core i7,Intel又重新開始采用超線程技術(shù)的升級版:SMT。
四核心的Core i7 EE-965開啟SMT技術(shù)后使用任務(wù)管理器觀察可以發(fā)現(xiàn)系統(tǒng)中增加了4個虛擬核心。在Core i7上,由于處理器具備更高的內(nèi)存帶寬和更大的緩存容量,同時內(nèi)核部分又根據(jù)SMT的特點進(jìn)行了增強設(shè)計,因此應(yīng)用起SMT來將更加得心應(yīng)手,更容易獲得性能的提升。根據(jù)測試,開啟SMT技術(shù)后的Core i7性能提升可在7~34%左右。
內(nèi)核微架構(gòu)也得到進(jìn)一步強化 采用新的微架構(gòu)、增加緩存容量并啟用SMT技術(shù),雖然可以起到顯著增強多處理器執(zhí)行效能的作用。但酷睿2當(dāng)年受歡迎的場面告訴我們,如果一款處理器的設(shè)計過多考慮多處理器執(zhí)行效能,而不能在對游戲等個人應(yīng)用更有意義的單核效率上比過去有明顯的提升,那么它將難以避免的面臨尷尬的境地。 有此前車之鑒,在保留Core微架構(gòu)總體上不變的基礎(chǔ)上,除了增加三級緩存,并對TLB結(jié)構(gòu)進(jìn)行改良之外,Intel還在Core i7中對影響單核效能的內(nèi)部微架構(gòu)進(jìn)行了許多有力的改良,現(xiàn)簡要概述如下: 1、前端的分支預(yù)測機構(gòu)方面,改用兩級式分支目標(biāo)緩存(BTB)結(jié)構(gòu),并改良了用于子程序調(diào)用時快速查找返回地址的返回地址棧(RSB)機構(gòu)。此外,Core i7還將擴容后的循環(huán)流檢測器(LSD)首次放到了解碼器的后方(在酷睿2中LSD被放在解碼器前面),這樣在性能和耗電方面都有實際意義; 2、前端的指令解碼部分,Core i7繼承并發(fā)展了酷睿中的宏融合技術(shù),現(xiàn)在宏融合技術(shù)在32位/64位兩種模式都可以發(fā)揮作用,并可以將更多的指令融合為一條微操作,無形中增大了解碼帶寬; 3、亂序執(zhí)行引擎的指令調(diào)度部分,指令隊列緩存、載定序緩存ROB、保留站RS等部件的容量比酷睿都得到進(jìn)一步擴展,并且根據(jù)SMT的需要進(jìn)行了一些調(diào)整;
4、此外,為了改善存儲、網(wǎng)絡(luò)文件和字符串處理的效能,Core i7中還增加了由7條新指令組成的SSE4.2擴展指令集。 這些改良不但有利于增強處理器的單核效率,而且還兼顧了SMT的需求,確保Core i7立于不敗之地。
一體化的頻率功率控制 最后,在Core i7的外核中集成了PCU單元,可以單獨控制內(nèi)核各個核心的頻率、電壓,并且還可以負(fù)責(zé)監(jiān)控核心溫度。 將供電控制放在內(nèi)核中,再配合新COMS材料的使用,使Core i7可以進(jìn)一步減小休眠狀態(tài)下的漏電流。而頻率控制功能的加入,則使各核的頻率與功耗控制更加靈活,可以根據(jù)實際的運行狀況配合操作系統(tǒng)進(jìn)行更精確的電源管理,做到既節(jié)省了電能,又不至于使性能過分降低。 而由此設(shè)計出智能加速技術(shù)(Intel Turbo Boost Technolgy, 也就是Turbo Mode)技術(shù),則在省電高效的基礎(chǔ)上,又大大增加了Core i7的可玩性。智能加速技術(shù)是在PCU和Intel舊有的Speedstep變頻省電這兩項技術(shù)的基礎(chǔ)上產(chǎn)生的一種新技術(shù)。在BIOS中打開Speedstep和Turbo mode之后,我們可以自由地設(shè)定各個核心的倍頻數(shù)。 經(jīng)過前面的說明,我們已經(jīng)對Core i7的單核多核效率,以及其全新的微架構(gòu)優(yōu)勢有了一定的了解。但多數(shù)高端玩家所關(guān)心的Core i7可超性,大家心中恐怕依然打著大大的問號。歷史原因,過去AMD的K7到K8再到K10,由于內(nèi)存控制器的加入而使可超性逐年下降,大家對此都已經(jīng)有了較深的印象,那么集成了內(nèi)存控制器的Core i7會不會也遇到同樣的問題呢?
可以說Core i7的超頻比過去酷睿2的超頻有了較大的變化。由于集成內(nèi)存控制器和QPI接口的加入,再加上Turbo Mode的引入,使Core i7的超頻更具難度與趣味性。我們首先把超頻過程中需要涉及到的頻率與電壓總結(jié)如下: Core i7中雖然具備多種部件,但它們的頻率都是以BCLK頻率(有點類似與過去的前端總線頻率)也就是133MHz為基準(zhǔn)生成的。 在Intel DX58SO主板上,BCLK頻率基準(zhǔn)由133-250可調(diào)。CPU核心頻率則可使用Turbo Mode技術(shù)由5-30倍頻進(jìn)行不同調(diào)節(jié)(非EE版可調(diào)倍頻可能會有所縮?。?。而IOH中包含的內(nèi)存控制器頻率則由BCLK乘12-30可調(diào)倍頻而形成。DDR3工作頻率則有BCLKx6/8/10/12四個檔次可調(diào)。而IOH中的QPI接口頻率,有BCLK x18/22/24三檔可調(diào)。
而非至尊版的Core i7如940/920等,則可能無法隨意調(diào)高處理器的倍頻,只能調(diào)節(jié)QPI與DDR3內(nèi)存的倍頻。 這里需要注意的是Turbo Mode技術(shù)是以Speedstep技術(shù)為基礎(chǔ)的,因此要想啟用Turbo Mode的設(shè)定,不僅要設(shè)置好Tuebo Mode本身的設(shè)定,而且還要打開Speedstep功能,才能正常進(jìn)入Turbo Mode模式。 電壓調(diào)節(jié)方面,除了CPU核心電壓和內(nèi)存電壓之外,IOH電壓相當(dāng)于過去的北橋電壓,而QPI接口電壓也是新增的可調(diào)選項。 進(jìn)入實際的BIOS設(shè)置過程,我們首先嘗試不調(diào)節(jié)外頻,而只對倍頻進(jìn)行調(diào)節(jié)。因此首先是處理器倍頻的設(shè)置說明。簡單地說,在Core i7 EE-965上,由于Maximum Non-Turbo Ratio最大只能調(diào)節(jié)到24倍頻。因此要達(dá)到更高的倍頻必需注意調(diào)節(jié)以下四處: 首先增加處理器的電壓,推薦增加到1.525V左右;接著打開Turbo Mode并設(shè)置好需要超的倍頻數(shù): 再將Speedstep功能打開,如果以超頻為目的,最好將這里其它的無關(guān)選項都關(guān)閉,如果以省電為目的,則保留原設(shè)置即可;最后,如果以超頻為目的,那么推薦將CPU IdleMode設(shè)為“High Performance”,這樣能避免超頻時的不穩(wěn)定;如果以節(jié)省電能為目的,那么推薦將其設(shè)為“Low Power”,再進(jìn)入操作系統(tǒng)中的電源管理中設(shè)置好省電模式即可。 只超倍頻的結(jié)果,是普通風(fēng)冷極限停留在29倍頻上,無論如何設(shè)置處理器電壓,都無法超過30倍頻穩(wěn)定進(jìn)入系統(tǒng)。 接著我們將BCLK頻率與倍頻一起設(shè)置進(jìn)行超頻,如前面所說,由于BCLK頻率是許多部件的基準(zhǔn)頻率,因此增加這個頻率就必須對許多關(guān)聯(lián)的選項進(jìn)行設(shè)置。 首先找到Performance中的Host Clock Frequency,將其設(shè)置為需要超到的數(shù)值(默認(rèn)頻率為133MHz),我們這里設(shè)置為200MHz。接著將處理器倍頻按上一節(jié)的說明設(shè)置為需要的數(shù)值,這里我們設(shè)置為21倍頻; 接下來調(diào)節(jié)內(nèi)存相關(guān)部分,將UCLK Multiplier(也就是我們前面所說的內(nèi)存控制器倍頻),和Memory Multiplier(也就是我們前面所說的DDR3內(nèi)存頻率倍數(shù))分別設(shè)置為16和8,這樣內(nèi)存控制器和DDR3將分別工作在200X16=3.2GHz和200X8=1.6GHz下。 而后再稍微增加內(nèi)存電壓至1.54V,這里需要注意的是,由于這里設(shè)置的內(nèi)存電壓不僅是DDR3內(nèi)存使用,而且還被提供給CPU內(nèi)存控制器使用,而根據(jù)各方面的消息稱其值超過1.6V將可能造成處理器內(nèi)存控制器的永久損壞,因此我們這里不推薦增壓到1.6V以上。 最后需要設(shè)置的還有QPI接口部分,將IOH Core Voltage Override增加到1.4V左右(默認(rèn)1.15V),如有必要,再將QPI Voltage Override電壓也增加到近似的電壓(默認(rèn)1.1V)。接著調(diào)整QPI Data Rate,原值為6.4GT/s,相當(dāng)于24倍頻,現(xiàn)在我們將它調(diào)整到4.8GT/s,相當(dāng)于18倍頻。 由于我們調(diào)整了BCLK,而它是CPU與內(nèi)存幾乎所有重要頻率的基準(zhǔn)頻率,因此牽一發(fā)而動全身,需要對許多電壓和倍頻進(jìn)行調(diào)節(jié),以保證BCLK超頻的成功。 經(jīng)過調(diào)節(jié),我們最終使用原配散熱器,沒費什么力就將Core i7 EE-965處理器超到了200X21=4.2GHz左右的水平,超頻幅度達(dá)31%左右。運算Super PI 1M的成績達(dá)到了驚人的9.719秒!如果使用酷睿2處理器,需要超頻幅度達(dá)到50%以上的4.7G左右,才能得到類似的成績。 Super PI的運算結(jié)果,與處理器的單核效能、內(nèi)存與緩存系統(tǒng)的延遲與帶寬都有相當(dāng)大的聯(lián)系,而Core i7相比酷睿2在這兩個方面的提升,也通過Super PI測試給我們留下了深刻的印象。 另外,通過對Core i7的超頻實踐,我們也發(fā)現(xiàn),相比酷睿2而言,新處理器的超頻顯得更為復(fù)雜,現(xiàn)在超頻需要考慮的不僅僅是主頻和外頻的提升,還要考慮內(nèi)存頻率及內(nèi)存帶寬的影響。 畢竟更多用戶還是更習(xí)慣在默認(rèn)狀態(tài)下使用處理器,因此在我們的超頻體驗結(jié)束后,還安排了Core i7 EE-965的默認(rèn)狀態(tài)測試。測試中Intel的DX580SO主板,金邦與宇瞻的DDR3 1333內(nèi)存,以及兩塊耕昇4850張飛版所組成的交火 本次測試全部在Vista SP1環(huán)境下進(jìn)行。軟件方面主要分四個部分,依次是測量系統(tǒng)綜合性能的PCMark Vantage測試;測試多媒體創(chuàng)作性能的Cinebench R10、POV-RAY測試;測試游戲綜合性能的3DMark2006/Vantage測試;以及測試游戲?qū)嶋H性能的Crysis:warhead/Farcry2。 這一部分主要是使用老牌測試廠商Futuremark的最新綜合性能測試軟件PCMark Vantage來進(jìn)行測試這一部分主要是使用支持超線程SMT的多媒體創(chuàng)作軟件Cinebench和POV-RAY進(jìn)行測試。 默認(rèn)測試:實際游戲性能 總結(jié)與建議 Core i7處理器的面市,以其全新的微架構(gòu),為Intel處理器陣營又增添了一員虎將。新架構(gòu)很好地滿足了上至服務(wù)器下至個人電腦的需求。服務(wù)器方面,集成的內(nèi)存控制器和全新的QPI接口大幅改善了多處理器交換數(shù)據(jù)的效率;而個人電腦方面,大幅改良的內(nèi)部微架構(gòu)也使處理器面對多媒體任務(wù)、游戲等應(yīng)用時更加得心應(yīng)手。而重新回歸的SMT技術(shù)則最大限度的發(fā)揮了多核系統(tǒng)的執(zhí)行效率。 可超性方面,新架構(gòu)帶來了全新的超頻思路,比較酷睿2而言,Core i7的超頻能給玩家?guī)砀嗵魬?zhàn)性和更高的可玩度。而即使是在一般的散熱條件下,超頻幅度也可以達(dá)到20-30%左右。解開了超頻愛好者們心中原有的重重顧慮。 但任何事物都有其反面,Core i7唯一的遺憾,恐怕便是由于微架構(gòu)變化較大,由此帶來較高的升級費用問題。用戶必須一次性升級內(nèi)存、主板、處理器。所幸該產(chǎn)品目前主要面向高端用戶。預(yù)計到明年下半年采用新微架構(gòu)的主流產(chǎn)品(Core i7的弟弟妹妹們)上市之后,系統(tǒng)的價格才會有所下降。 |
|