|
||||
AMD今天提前五個月正式發布了代號『伊斯坦布爾』的六核心服務器,型號為Opteron 2400/8400系列。AnandTech也同時放出了相關評測文章,詳細講述了相關最新技術特性,並對實際性能進行了測試。
『伊斯坦布爾』采用直連架構的原生六核心設計,全面適合雙路、四路、八路服務器市場,支持AMD-V虛擬化技術和AMD-P電源管理技術套裝,繼續采用Socket F 1207平臺和低價高能效DDR2內存架構,性能每瓦特相比上代四核心『上海』最多提昇34%。
IBM、Cray、Sun、戴爾、惠普等都將從本月起出貨采用伊斯坦布爾處理器的服務器系統,主板和基礎架構合作伙伴也會提供支持。
一、引言
在經過第一代65nm工藝四核心『巴塞羅那』的鋪墊後,昇級到45nm的四核心『上海』在發布時堪稱是當時最出色的服務器處理器,不過就在今年三月底,Intel將Nehalem架構引入了服務器領域,全新的Xeon 5500系列完全橫掃了雙路領域,很多時候領先對手60-85%,這也是自AMD進軍服務器市場以來Intel取得的最大幅度的領先優勢。
這時候六核心伊斯坦布爾就顯得尤為重要了。現在距離上海發布纔整整半年,AMD就增加了兩個核心、昇級了集成內存控制器(IMC),而且首批頻率就達到了2.6GHz,更令人印象深刻的是功耗只比2.7GHz的上海略微高出幾瓦。
六核心伊斯坦布爾的Opteron 8435 2.6GHz
二、六核心的優劣
當Intel發布同樣六核心的『Dunnington』的時候,就很少有應用程序能充分發揮這些核心的潛能,伊斯坦布爾也面臨同樣的問題。有些服務器程序傾向於利用2n個核心,很少一部分能擴展到八核心上,至於能用滿十六核心的非常罕見。是的,不止是桌面上,服務器裡也有很多程序的多核心擴展性很有限,比如郵件服務器、網絡服務器、部分數據庫等,渲染程序也會在核心數超過八個的時候性能急劇下滑。
當然六核心也有好處。Nehalem Xeon有四個物理核心、八個邏輯核心,但每兩個線程需要共享32KB一級緩存和256KB二級緩存,而伊斯坦布爾的每個核心都能獨享64KB一級緩存和512KB二級緩存。顯然,伊斯坦布爾的主攻方向是計算敏感HPC、大規模數據庫,特別是高負載的虛擬化應用。
順便提一點,伊斯坦布爾和上海的內存支持能力其實差不多,所以使用新系統的時候可能會首先碰到內存資源緊張,然後纔是計算能力不足。
六核心伊斯坦布爾核心照
三、伊斯坦布爾技術改進
與上海相比,伊斯坦布爾除了增加兩個內核外變化並不大,主要有一下四個方面:
-探測過濾器『HT Assist』:
之前多次介紹過這種探測過濾器技術,下邊對比一下就更明白了。
上邊是四核心上海簡圖。CPU 3可能需要CPU 1纔有權訪問的緩存行(cacheline),但事實上最近的數據在CPU 2的二級緩存裡,這時候流程如下:
1、CPU 3向CPU 1請求數據(藍色實心箭頭)
2、CPU 1發出廣播,看其它CPU核心誰有所需數據、誰的距離最近(三個紅色實心箭頭)
3、CPU 3等待問題解決(四個紅色空心箭頭)
4、請求數據從CPU 2傳輸給CPU 3(兩個藍色空心箭頭)
這種廣播式處理方法有兩個嚴重缺點:一是簡單的請求就需要十次處理,浪費大量帶寬;二是這十次處理給CPU 3上的指令增加了大量延遲。
解決方案就是基於目錄的探測式系統,AMD叫作HT Assist。它在每顆處理器上保留1MB三級緩存作為一個目錄,跟蹤系統其它地方使用的緩存行。這樣,雖然三級緩存只剩下了5MB,但省去了大量的探測傳輸。
上邊就是新的六核心伊斯坦布爾簡圖。還是之前的問題,流程就變成了:
1、CPU 3向CPU 1請求數據(藍色實心箭頭)
2、CPU 1檢查三級緩存目錄緩存來定位所需數據(鮮紅色粗箭頭)
3、直接向相關數據最近的CPU 2發送請求(深紅色實心箭頭)
4、請求數據從CPU 2發送到CPU 3(兩個藍色空心箭頭)
處理次數從十次減少到了五次,可大大降低延遲、節省帶寬。對於四路系統來說,內存帶寬可以多出60%:沒有HT Assist是25.5GB/s,有了就可以達到41.5GB/s。
特別指出,HT Assist只對四路、八路系統有用,特別是後者,對雙路系統就完全沒用了,因為只有兩顆處理器。再加上HT Assist還會佔用三級緩存,所以在雙路系統裡應該禁用它,在BIOS裡顯示為『Probe Filter』。
- X8 ECC:
內存條上的每一顆內存芯片都提供4-bit或8-bit位寬,分別叫作x4和x8,這樣組成64-bit位寬就需要16顆x4芯片或8顆x8芯片,所以內存條上至少要有八顆芯片(單面或雙面)。伊斯坦布爾的內存控制器現在支持x4和x8兩種類型內存條的錯誤校驗(ECC)了。
-遠程電源管理界面『APML』:
提供一個借助P-State電源狀態限制來監視、控制平臺功耗的界面,無需進入BIOS調教。對於大規模數據中心來說,逐臺服務器進入BIOS調整電源管理參數是很恐怖的,APML就是個很方便的解決方法。
服務器系統需要一顆處理器和BMC(管理處理器)來支持APML,軟件方面也有一定要求。軟硬件都還在研發中,所以伊斯坦布爾發布之初該功能暫不可用。
-更快的HT總線速度:
上海處理器的HT 3.0總線最高速度為2.2GHz DDR,每方向帶寬8.8GB/s,伊斯坦布爾則提高到2.4GHz DDR,也就是9.6GB/s,和Nehalem Xeon低端版本的QPI總線帶寬相同。
該功能要等到AMD的Fiorano平臺纔能完全實現,現在搭配NVIDIA MCP55平臺還是限制在2.2GHz DDR。
四、首發產品線
第一批伊斯坦布爾有五款型號,均為75W標准型,而105W SE高性能版、55W節能版、40W超低功耗版將在第三季度推出。
面向雙路應用的有Opteron 2435/2431/2427三款,主頻2.6/2.4/2.2GHz,二級緩存6×512KB,三級緩存6MB,單向互連帶寬9.8GB/s或8.8GB/s。
價格上這三款新品分別需要989美元、698美元和455美元。
面向八路應用的則有Opteron 8435/8431兩款,主頻2.6/2.4GHz,售價2649美元和2149美元。
再看看AMD、Intel最近幾代服務器處理器的生產工藝、晶體管數量、核心面積和核心數量。伊斯坦布爾的集成度和上海差不多,但晶體管數量不到Dunnington的一半、核心面積則是將近七成。
五、性能實測
服務器應用和性能指標距離普通桌面用戶太遠,所以就不詳細闡述了,數據和柱狀圖可以說明一切,相信大家很容易就能看清上海、伊斯坦布爾、Nehalem Xeon等之間的性能差異。
六、功耗
這部分的測試還只完成了一少部分,還需要重新檢查,所以這裡只簡單提一下:滿載狀態下Opteron 2435系統比Xeon X5570系統省電大約35-45W,在略高於300W的系統上這一差距非常明顯;至於待機系統功耗,現在看似乎Nehalem Xeon略微佔優。
七、小結
就單路和雙路應用而言,伊斯坦布爾相比同頻上海在OLTP、ERP、Reporting、OLAP、HPC、虛擬化等方面能帶來的性能提昇少則5%、多則27-46%,可惜Web方面反而會下滑3%。Xeon X5570 2.93GHz與Opteron 2435 2.6GHz相比,優勢相當明顯,除了虛擬化應用大部分不相上下外,OLTP、ERP、Reporting、OLAP、Web、HPC能勝出14-50%。
很顯然,伊斯坦布爾取代不了Nehalem Xeon 5500系列,後者擁有超線程技術和更高的頻率、IPC、內存帶寬,在OLTP、ERP、網絡服務、渲染、高性能計算(HPC)等領域依然還是首選。
當然伊斯坦布爾也不是毫無用武之地。綜合考慮性能、功耗和成本,至少有兩個領域非常適合伊斯坦布爾:決策支持數據庫,和虛擬化。
AnandTech最後透露,伊斯坦布爾在四路領域是非常可怕的競爭對手,但詳細評測還要稍後纔會完成。