|
||||
SLI、交火不算什麼,Larrabee的多內核設計!
目前的GPU全是采用單核芯片設計,圖形顯示系統要想達到更高的性能只能采用雙GPU設計或雙卡、四卡並聯運行方案。這在成本上往往是用戶所不能接受的。而在Larrabee上,INTEL采用多核心設計,這也將是首款采用多核設計的GPU。根據INTEL初步的計算,最初Larrabee的核心數量將會是16個核心,今後按照翻倍的步進也許會昇級到32個核心。這是因為要應付目前主流的3D圖形的運算,起步至少要16個核心纔可以從容應對,但是24個核心的產品也是有可能的,畢竟以目前的生產工藝來看做到這一點完全是沒有問題的。
半導體芯片核心
目前我們的半導體芯片核心面積可以做到286平方毫米,NVIDIA的GT200和AMD的RV770就處在這個層次上。因此在Larrabee集成更多的處理核心應該並非難事。假設INTEL要想集成40個處理核心,那麼至少需要572平方毫米的芯片。事實上NVIDIA的GT200使用的是65nm制造工藝技術,如果INTEL用最為先進的32nm制造工藝技術,那麼芯片的尺寸還會大幅縮小。就目前的INTEL 45nm制造工藝來說,芯片的核心面積可以減小至少50%,但是根據INTEL的說法,只要轉產到45nm,甚至可以減小到60?70%的樣子。屆時Larrabee將能集成更多的處理核心。INTEL推測,40個核心45nm版本的Larrabee其核心面積約為370平方毫米。像NVIDIA的產品線一樣,INTEL也會將芯片根據核心數量分成不同的檔次,面向不同人群推出。
游戲性能與核心數量的增長趨勢
根據INTEL的說法,這種特性在《戰爭機器》、《F.E.A.R.》、《半條命2:第二章》等游戲中表現最明顯,實際性能基本隨著核心數量呈線性增長趨勢。如果8核心的性能算作1,那麼16核心就約等於2、24核心約等於3、32核心約等於4。如果一直這樣增長下去,那Larrabee的實力將是恐怖的。不過INTEL也承認,隨著核心數量的繼續增多,這種線性關系會逐漸減弱,到了40核心只有3.8-3.9,48核心就僅僅4.4-4.6了,64核心甚至可能都不到7。因此如果解決多核心中復雜的數據共享問題及功耗問題,這都是INTEL需要面對的。
除此之外,Larrabee還同時能夠支持4路硬件線程。而Larrabee也能夠在CPU內核心進行4組套轉換。INTEL CPU比如Nehalem都支持2-way多線程,Larrabee則為4-way multi-threadCPU。而GPU產品中支持多線程的則很少。GPU產品通常配備有數十以上的線程硬件轉換功能。比如GeForce GTX 200(GT200)在32寄存器/線程時轉換為16warp(NVIDIA用語)。根據Larrabee的資料,硬件多線程設計是為了在進行編譯的時候減少二級緩存的等待時間為目的。這與GPU的硬件多threading不同。另外Larrabee的硬件多線程比GPU少的原因是架構上的不同。值得注意的是,INTEL指出Larrabee『全面支持IEEE標准單、雙精度浮點運算』,但沒有透露具體指標。AMD和NVIDIA顯卡在單精度方面表現都很出色,RV770系列已經輕松超過1TFlops,不過雙精度性能還相差甚遠,比如Tesla的單精度性能可達900-1000GFlops,雙精度就只有100GFlops左右。如果出Larrabee全雙精度浮點運算的話,那麼它的通用運算能力要遠遠強於當前的GPU。
盡管INTEL進軍獨立顯卡市場的野心已然明確,但據消息來源表示,目前很多細節還處於混沌狀態。INTEL將會在今年第四季度公開發布詳細完整的獨立顯卡產品線roadmap。到那個時候,Larrabee顯卡纔會變得更加清晰。相較於GPGPU來說,它最大的優勢就在於采用了大家熟悉的x86架構。目前多數的軟件工程師仍不熟悉如何將GPU應用在多任務處理及平行運算上,這點就佔了不少優勢。如果順利的話,INTEL將肯定在2008年展示Larrabee系列獨立顯卡。根據比較可靠的消息來看,Larrabee項目其實是隸屬於Tera-Scale計劃(『萬億級別計算研究項目』。這個計劃的重要工作內容,就是分析未來10年內人們對電腦及服務器的應用需求。這一計劃涉及的研究領域非常廣泛,共有超過400間大學、美國國防部高等研究計劃局(DARPA) ,以及像是微軟與惠普等相關公司,共同為Larrabee應用進行研究。