王者之間的對決——45nm Penryn VS 65nm Conroe-IT浪潮-北方網
新聞 | 天津 | 民生 | 廣電 | 津抖雲 | 微視 | 讀圖 | 文娛 | 體育 | 圖事 | 理論 | 志願 | 專題 | 工作室 | 不良信息舉報
教育 | 健康 | 財經 | 地產 | 天津通 | 旅游 | 時尚 | 購物 | 汽車 | IT | 親子 | 會計 | 訪談 | 場景秀 | 發布系統

"津雲"客戶端
  您當前的位置 : 北方網  >  IT浪潮  >  硬件  >  CPU|內存|硬盤  >  評測
關鍵詞:

王者之間的對決——45nm Penryn VS 65nm Conroe


http://www.enorth.com.cn  2008-03-26 16:01
    想要顯著處理器的提昇性能,無外乎四種方法:改進微處理器架構、增加處理器核心數量、提昇頻率以及增加二級緩存。而就目前的使用環境來說,有的時候增加處理器核心數量並不能很好的帶來性能提昇,而架構更新一般屬於整代產品更新之際纔能出現。因此在需要沿用數年相同架構的處理器來說,主頻和二級緩存則成為了提昇性能,拉開產品差距的主要手段。

(以下引用www.zol.com.cn,超能網等有關數據進行對比測試說明)

  新老對比


  你能看的出來哪個是老肉哪個是新肉麼?

45nm架構微調、性能提高

Intel Penryn 45nm處理器雖然在架構上與之前的酷叡處理器架構差別不大,但是一些改良還是讓新一代的Intel 45nm處理器有了更好的表現。比如增添的47條影音多媒體指令(SSE4指令集,架構的優化,更高的主頻,更大的二級緩存,更低的功耗,等等

下面簡單的講下45nm penryn同老core性能上的優勢
『增強高速緩存拆分負載功能(Split Load Cache Enhancement)』
在Intel的酷叡2雙核心處理器設計中,每個獨立的核心都有自己的一級緩存,酷叡微架構透過核心內部的『Shared Bus Router』來共享的二級緩存,例如當一個核心處理完數據並將其存放在二級緩存中時,另外一顆核心便可通過『Shared Bus Router』來讀取另一個核心存放在二級緩存中的數據,這樣的數據讀取和交換速度要遠遠大於通過前端總線進行數據傳遞,而L2 & DCU Data Pre-fetchers及Deeper Write output緩衝存儲器的采用更是加大了緩存的命中率,『Shared Bus Router』和『Bandwidth Adaptation』技術還分別優化了數據傳輸排程和共享前端總線時候的效率。這也是酷叡微架構具有優異性能的一大原因。雖然具有上述這些技術讓酷叡微架構具有強勁的性能,但是面對通過前端總線進行數據交換的四核心處理器來說,酷叡微架構的性能發揮卻收到了一定的制約。

Penryn 45nm處理器的二級緩存容量相比65nm的二級緩存增加了50%,雙核心產品二級緩存容量最大可達至6MB、四核心更是達到了12MB,Intel也是考慮到了四核心的一些限制問題,因此提昇到了24路組相聯(24-way set Associative) ,令二級緩存命中率進一步提昇,從而讓性能獲得更好表現。

此外,Penryn 45nm處理器加入了名為『增強高速緩存拆分負載功能(Split Load Cache Enhancement)』的全新技術。當需要數據讀取時,如果數據位於兩個不同的高速緩存當中時,將會對在高速緩存中的數據進行拆分,讓一個高速緩存進行數據讀取,其速度要高於數據在兩個高速緩存中進行讀取和處理要快上許多。該技術我們可以看成是酷叡微架構中高速智能緩存技術的增強版本。

Fast Radix-16 Divider快速Radix-16除法器
原有的酷叡微架構可以支持每個周期同時處理4個指令,並且重新使用了較高效率的14層『Pipeline Stages』(流水線處理站)。

Penryn 45nm處理器在原有的架構上對除法器進行了改良,Intel稱其為『Fast Radix-16 Divider快速Radix-16除法器』。改良之後的除法器在運行科學計算、三維坐標轉換和其他數學密集型運算的時候,會帶來比原來高兩倍的運算速度,並可以加速浮點和整數運算的速度。其重要原理就在於,通過Radix-16除法器的采用,使得當面對基數提昇到16的運算時,該功能會每次運算出4位商值,將運算延遲縮短了一倍。

Super Shuffle Engine超級流水線引擎
Intel在酷叡微架構中加入128Bit-SIMD 整數運算(Interger Arithmetic)及128bit SIMD雙倍精准度浮點運算(Floating-Point Operations)單元。舊有的處理器執行128Bit的SSE、SSE2及SSE3指令時,需要把指令分拆為2個64Bit指令,在2個頻率周期完成,但酷叡微架構則只需要一個頻率周期便能完成,執行效率提昇了一倍。經過多年的推廣,SSE指令集已經被目前的繪圖、影音、壓縮、加密、數學運算等應用所廣泛采用,而單周期128Bit的處理器能力則成倍地提高了運算效率。

Penryn 45nm處理器在這些方面也進行了改良,其加入全新Super Shuffle Engine(超級流水線引擎),可以讓SSE指令更具效率的運行。以往在處理128Bit寬度的字節(Byte)、字(Word)及雙字(DWord) SSE數據時,是無法在一個周期內完成,而超級流水線引擎的加入可讓這些不同性質的128Bit SSE指令,在1個周期內便可完成,減低延遲及吞吐量。

  SSE 4.1指令集

在Penryn 45nm處理器中,Intel加入了全新的SSE4.1指令集,SSE4指令集目前分為4.1和4.2兩個版本。其增強指令主要針對向量繪圖運算、3D游戲、視音頻編碼加速及協同處理加速方面。

Intel指出,加入的SSE4指令集讓Penryn 45nm處理器增加了2個不同的32Bit向量整數乘法運算單元,並加入8位無符號 (Unsigned)最小值及最大值運算,以及16Bit 及32Bit 有符號 (Signed) 運算。在面對支持SSE4指令集的軟件時,可以有效的改善編譯器效率及提高向量化整數及單精度代碼的運算能力。同時,SSE4改良插入、提取、尋找、離散、跨步負載及存儲等動作,令向量運算進一步專門化。

SSE4還加入了六條浮點運算指令,支持單精度、雙精度浮點運算及浮點產生操作,可立即轉換其路徑模式,大大減少延誤,這些支持將會在3D游戲及對浮點運算能力非常敏感的領域起到積極的效果。

此外,SSE4指令集還加入了串流式負載指令,能夠提昇幀緩衝區的讀取數據頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,並可以將其保存在臨時緩衝區內,讓支持SSE4指令集的讀取頻寬效能提昇最高至8倍。

以上皆為理論知識,下面讓我們通過測試來感受一下全新的INTEL 45NM PENRYN所帶來的驚喜吧。

平臺介紹:
AMD平臺
CPU: AMD Athlon 64 X2 6400+ (Socket AM2, 3.0GHz, 2x1024KB L2, Windsor),65納米
主板: ASUS M2R32-MVP (Socket AM2, AMD 580X)
內存: 2GB DDR2-800 with 4-4-4-12-1T timings (GEIL 大黑龍)
顯卡XFX GeForce 8800GTX (PCI-E x16)
硬盤: Western Digital WD1500AHFD (SATA150)
操作系統: Microsoft Windows Vista x86

Intel Core 2 Duo E8500 (LGA775, 3.16GHz, 1333MHz FSB, 6MB L2, Wolfdale),45納米
Intel Core 2 Duo E8400 (LGA775, 3.0GHz, 1333MHz FSB, 6MB L2, Wolfdale),45納米
Intel Core 2 Duo E8200 (LGA775, 2.66GHz, 1333MHz FSB, 6MB L2, Wolfdale),45納米
Intel Core 2 Duo E6850 (LGA775, 3.0GHz, 1333MHz FSB, 4MB L2, Conroe),65納米
Intel Core 2 Duo E6750 (LGA775, 2.66GHz, 1333MHz FSB, 4MB L2, Conroe),65納米
主板: ASUS P5k-E (LGA775, Intel p35, DDR2 SDRAM)
內存: 2GB DDR2-1066 with 5-5-5-15 timings (Geil 大黑龍)
顯卡:XFX GeForce 8800GTX
硬盤: Western Digital WD1500AHFD (SATA150)
操作系統: Microsoft Windows Vista x86

Part 1 SYSMARK2007測試
(SYSMARK2007介紹:SYSmark系列出自Bapco組織,之所以稱其為組織是因為Bapco是一家專門面向企業的非盈利性組織,既然屬於非盈利性組織那麼她的公正性就不會像FutureMark那樣受到各種利益和隸屬關系的糾纏,也更容易做到真實和公平。由於合作關系廣泛其SYSmark評測軟件也具有廣大普遍性。其合作廠商包括了各種硬件、軟件廠商以及著名媒體包括:AMD、Apple、ARCintuition、Atheros Communications、CNET、Compal Electronics、Dell、Hewlett-Packard、Intel、Lenovo、Microsoft、NVIDIA、Toshiba、VNU Business Publications Limited(UK)、ZDNet以及Ziff Davis Media等16家。

而相對於現在流行的PCMark系列,SYSmark的特點就是以真實、貼切的應用軟件以及模擬真實用戶在計算機上的操作來得出計算機的性能數據。這樣做的優勢就是可以更好的結合實際而不必讓用戶對於像PCmark得分一樣的測試結果感到困惑。

  SYSmark將經常使用到的軟件的應用分成了4大類,包括電子學習、視頻制作、辦公效率、3D建模。讓用戶可以方便的知道計算機在自己常用領域的表現如何。這樣就可以做到貼切的反映計算機的整體性能。而PCmark系列所采用的測試插件全部由自己開發,不具有普遍性和與其他軟件的可比性,所以其測試結果對於反映真實系統性能是不夠嚴謹的。)

Part 3 實際游戲效能測試

測試游戲1
DirectX 10游戲大作
Crysis(末日之戰)
游戲介紹:

  一直為玩家津津樂道的第一人稱射擊游戲《孤島驚魂》(FarCry)的續作《末日之戰》(Crysis)早已公布,這是德國游戲開發商Crytek繼《孤島驚魂》之後,精心打造的第二款熱點大作,該作將於今年秋季上市。在微軟的PDC大會上,Crytek就展示了一段使用DirectX10aPI的CrytekEngine2引擎的視頻,視頻包括了動態的日夜循環、陽光透射、實時軟陰影、軟粒子以及完全互交可毀壞的環境,容積雲和高級著色器技術等特性。

測試游戲2
unreal tournament3(虛幻競技場3)
游戲介紹:
雖然說等待了很長時間,但是最終我們還是盼來了Epic第一款基於PC的 Unreal Engine 3,雖然目前離最終版的Unreal Tournament 3 推出還有一些時日,不過在上周推出的beta版游戲就佔用了我們不少時間進行相關的基准測試。通過這款出色的游戲, Epic公司的 Unreal Engine 3可以說是真正讓我們體驗到了新一代游戲的感覺,同時通過此次的試玩也讓我們真正感覺到新游戲對於CPU及顯卡的要求已經明顯要高於 Valve公司的 Source引擎,雖然對硬件的要求還沒有達到像Oblivion那樣變態,但是UE3也確實現可以算得上是當前對電腦硬件要求最高的游戲之一。
E8000系列(45納米)相對E6000系列(65納米)的優勢在這裡已經顯而易見,在SSE4被軟件開發商普遍采用後,這一結果還會向有利Wolfdale的方向傾斜。

  CPU功耗對比:

  總結:

新架構,制造工藝的提昇,更大的二級緩存,使得E8000系列的CPU異常的強大連自家前輩也不在話下,從數據上來看雖然性能上只有4%-11%的一個提昇,但是相對的功耗更低了,基本上又低了差不多40%,這樣一來零噪音的被動散熱基本可以實現了。另外,雖然是新品上價,但『高貴不貴』。以E6550與E8200為例,E8200系列有著比E6550更高的主頻與更大的二級緩存,但是兩者的售價卻基本相同。而且E8000系列無論是性能還是功耗上卻更勝一躊。當新處理器和老處理器達到了相同的價位的時候,也就預示著老的產品將光榮的退役了。Core 2 Duo E8500將取代今天的Core 2 Duo E6850;Core 2 Duo E8400將取代今天的Core 2 Duo E6750;Core 2 Duo E6550 也將會被Core 2 Duo E8200所取代。也就是說,用不了多久,消費者就可以用目前老處理器的價格買到性能更高的新產品了。
編輯:趙海濤
[進入IT論壇]
請您文明上網、理性發言並遵守相關規定,在注冊後發表評論。
 北方網精彩內容推薦
無標題文檔
天津民生資訊
天氣交通 天津福彩 每月影訊 二手市場
空氣質量 天津股票 廣播節目 二手房源
失物招領 股市大擂臺 天視節目 每日房價
熱點專題
北京奧運聖火傳遞和諧之旅 迎奧運 講文明 樹新風
解放思想 乾事創業 科學發展 同在一方熱土 共建美好家園
2008天津夏季達沃斯論壇 《今日股市觀察》視頻
北方網網絡相聲頻道在線收聽 2008高考招生簡章 復習衝刺
天津自然博物館館藏精品展示 2008年天津中考問題解答
帶你了解08春夏服飾流行趨勢 完美塑身 舞動肚皮舞(視頻)
C-NCAP碰撞試驗—雪佛蘭景程 特殊時期善待自己 孕期檢查
熱點新聞排行 財經 體育 娛樂 汽車 IT 時尚 健康 教育

Copyright (C) 2000-2021 Enorth.com.cn, Tianjin ENORTH NETNEWS Co.,LTD.All rights reserved
本網站由天津北方網版權所有