|
||||
在奔騰4時代,Intel便推出了超線程技術,這項技術允許將一個真實處理器核心模擬為兩個虛擬核心,這樣在理想的條件下,處理互不衝突的多線程任務時,便能充分利用每個核心中的空閑執行單元。
但是在酷叡核心中,Intel並沒有繼續采用這項技術。如今發展到Core i7,Intel又重新開始采用超線程技術的昇級版:SMT。
四核心的Core i7 EE-965開啟SMT技術後使用任務管理器觀察可以發現系統中增加了4個虛擬核心。在Core i7上,由於處理器具備更高的內存帶寬和更大的緩存容量,同時內核部分又根據SMT的特點進行了增強設計,因此應用起SMT來將更加得心應手,更容易獲得性能的提昇。根據測試,開啟SMT技術後的Core i7性能提昇可在7~34%左右。
內核微架構也得到進一步強化
采用新的微架構、增加緩存容量並啟用SMT技術,雖然可以起到顯著增強多處理器執行效能的作用。但酷叡2當年受歡迎的場面告訴我們,如果一款處理器的設計過多考慮多處理器執行效能,而不能在對游戲等個人應用更有意義的單核效率上比過去有明顯的提昇,那麼它將難以避免的面臨尷尬的境地。
有此前車之鑒,在保留Core微架構總體上不變的基礎上,除了增加三級緩存,並對TLB結構進行改良之外,Intel還在Core i7中對影響單核效能的內部微架構進行了許多有力的改良,現簡要概述如下:
1、前端的分支預測機構方面,改用兩級式分支目標緩存(BTB)結構,並改良了用於子程序調用時快速查找返回地址的返回地址棧(RSB)機構。此外,Core i7還將擴容後的循環流檢測器(LSD)首次放到了解碼器的後方(在酷叡2中LSD被放在解碼器前面),這樣在性能和耗電方面都有實際意義;
2、前端的指令解碼部分,Core i7繼承並發展了酷叡中的宏融合技術,現在宏融合技術在32位/64位兩種模式都可以發揮作用,並可以將更多的指令融合為一條微操作,無形中增大了解碼帶寬;
3、亂序執行引擎的指令調度部分,指令隊列緩存、載定序緩存ROB、保留站RS等部件的容量比酷叡都得到進一步擴展,並且根據SMT的需要進行了一些調整;
4、此外,為了改善存儲、網絡文件和字符串處理的效能,Core i7中還增加了由7條新指令組成的SSE4.2擴展指令集。
這些改良不但有利於增強處理器的單核效率,而且還兼顧了SMT的需求,確保Core i7立於不敗之地。
一體化的頻率功率控制
最後,在Core i7的外核中集成了PCU單元,可以單獨控制內核各個核心的頻率、電壓,並且還可以負責監控核心溫度。
將供電控制放在內核中,再配合新COMS材料的使用,使Core i7可以進一步減小休眠狀態下的漏電流。而頻率控制功能的加入,則使各核的頻率與功耗控制更加靈活,可以根據實際的運行狀況配合操作系統進行更精確的電源管理,做到既節省了電能,又不至於使性能過分降低。
而由此設計出智能加速技術(Intel Turbo Boost Technolgy, 也就是Turbo Mode)技術,則在省電高效的基礎上,又大大增加了Core i7的可玩性。智能加速技術是在PCU和Intel舊有的Speedstep變頻省電這兩項技術的基礎上產生的一種新技術。在BIOS中打開Speedstep和Turbo mode之後,我們可以自由地設定各個核心的倍頻數。
可以說Core i7的超頻比過去酷叡2的超頻有了較大的變化。由於集成內存控制器和QPI接口的加入,再加上Turbo Mode的引入,使Core i7的超頻更具難度與趣味性。我們首先把超頻過程中需要涉及到的頻率與電壓總結如下:
Core i7中雖然具備多種部件,但它們的頻率都是以BCLK頻率(有點類似與過去的前端總線頻率)也就是133MHz為基准生成的。
在Intel DX58SO主板上,BCLK頻率基准由133-250可調。CPU核心頻率則可使用Turbo Mode技術由5-30倍頻進行不同調節(非EE版可調倍頻可能會有所縮小)。而IOH中包含的內存控制器頻率則由BCLK乘12-30可調倍頻而形成。DDR3工作頻率則有BCLKx
而非至尊版的Core i7如940/920等,則可能無法隨意調高處理器的倍頻,只能調節QPI與DDR3內存的倍頻。
這裡需要注意的是Turbo Mode技術是以Speedstep技術為基礎的,因此要想啟用Turbo Mode的設定,不僅要設置好Tuebo Mode本身的設定,而且還要打開Speedstep功能,纔能正常進入Turbo Mode模式。
電壓調節方面,除了CPU核心電壓和內存電壓之外,IOH電壓相當於過去的北橋電壓,而QPI接口電壓也是新增的可調選項。
首先增加處理器的電壓,推薦增加到1.525V左右;接著打開Turbo Mode並設置好需要超的倍頻數:
再將Speedstep功能打開,如果以超頻為目的,最好將這裡其它的無關選項都關閉,如果以省電為目的,則保留原設置即可;最後,如果以超頻為目的,那麼推薦將CPU IdleMode設為『High Performance』,這樣能避免超頻時的不穩定;如果以節省電能為目的,那麼推薦將其設為『Low Power』,再進入操作系統中的電源管理中設置好省電模式即可。
只超倍頻的結果,是普通風冷極限停留在29倍頻上,無論如何設置處理器電壓,都無法超過30倍頻穩定進入系統。
首先找到Performance中的Host Clock Frequency,將其設置為需要超到的數值(默認頻率為133MHz),我們這裡設置為200MHz。接著將處理器倍頻按上一節的說明設置為需要的數值,這裡我們設置為21倍頻;
接下來調節內存相關部分,將UCLK Multiplier(也就是我們前面所說的內存控制器倍頻),和Memory Multiplier(也就是我們前面所說的DDR3內存頻率倍數)分別設置為16和8,這樣內存控制器和DDR3將分別工作在200X16=3.2GHz和200X8=1.6GHz下。
而後再稍微增加內存電壓至1.54V,這裡需要注意的是,由於這裡設置的內存電壓不僅是DDR3內存使用,而且還被提供給CPU內存控制器使用,而根據各方面的消息稱其值超過1.6V將可能造成處理器內存控制器的永久損壞,因此我們這裡不推薦增壓到1.6V以上。
最後需要設置的還有QPI接口部分,將IOH Core Voltage Override增加到1.4V左右(默認1.15V),如有必要,再將QPI Voltage Override電壓也增加到近似的電壓(默認1.1V)。接著調整QPI Data Rate,原值為6.4GT/s,相當於24倍頻,現在我們將它調整到4.8GT/s,相當於18倍頻。
由於我們調整了BCLK,而它是CPU與內存幾乎所有重要頻率的基准頻率,因此牽一發而動全身,需要對許多電壓和倍頻進行調節,以保證BCLK超頻的成功。
Super PI的運算結果,與處理器的單核效能、內存與緩存系統的延遲與帶寬都有相當大的聯系,而Core i7相比酷叡2在這兩個方面的提昇,也通過Super PI測試給我們留下了深刻的印象。
另外,通過對Core i7的超頻實踐,我們也發現,相比酷叡2而言,新處理器的超頻顯得更為復雜,現在超頻需要考慮的不僅僅是主頻和外頻的提昇,還要考慮內存頻率及內存帶寬的影響。
本次測試全部在Vista SP1環境下進行。軟件方面主要分四個部分,依次是測量系統綜合性能的PCMark Vantage測試;測試多媒體創作性能的Cinebench R10、POV-RAY測試;測試游戲綜合性能的3DMark2006/Vantage測試;以及測試游戲實際性能的Crysis: warhead/Farcry2。
這一部分主要是使用老牌測試廠商Futuremark的最新綜合性能測試軟件PCMark Vantage來進行測試這一部分主要是使用支持超線程SMT的多媒體創作軟件Cinebench和POV-RAY進行測試。
Core i7處理器的面市,以其全新的微架構,為Intel處理器陣營又增添了一員虎將。新架構很好地滿足了上至服務器下至個人電腦的需求。服務器方面,集成的內存控制器和全新的QPI接口大幅改善了多處理器交換數據的效率;而個人電腦方面,大幅改良的內部微架構也使處理器面對多媒體任務、游戲等應用時更加得心應手。而重新回歸的SMT技術則最大限度的發揮了多核系統的執行效率。
可超性方面,新架構帶來了全新的超頻思路,比較酷叡2而言,Core i7的超頻能給玩家帶來更多挑戰性和更高的可玩度。而即使是在一般的散熱條件下,超頻幅度也可以達到20-30%左右。解開了超頻愛好者們心中原有的重重顧慮。
但任何事物都有其反面,Core i7唯一的遺憾,恐怕便是由於微架構變化較大,由此帶來較高的昇級費用問題。用戶必須一次性昇級內存、主板、處理器。所幸該產品目前主要面向高端用戶。預計到明年下半年采用新微架構的主流產品(Core i7的弟弟妹妹們)上市之後,系統的價格纔會有所下降。