|
||||
NVIDIA今天宣告了下一代GPU架構『帕斯卡』,擁有統一虛擬尋址、3D Memory立體堆疊整合顯存、NVLink高速互連通道等殺手?。其實,NVIDIA已經有了帕斯卡核心顯卡的初期樣品,但沒有拿出實物,而是公布了一張概念圖。
這張卡的設計非常獨特,但需要特別注意的是,至少就目前了解到的情況,它並不是普通桌面上的GeForce,而是高性能計算領域的Tesla。從照片上看,這種新的設計不但體積小巧(官方稱只有目前高端卡的約1/3),而且不再是垂直插入主板的PCI-E擴展卡,改成了橫躺在主板上的子卡樣式,並通過新設計的NVLink總線和系統相連。
僅此一點就可以說明,這種設計在普通桌面上是行不通的,NVIDIA對於主板行業沒有話語權,但是在服務器領域,特別是那些需要緊湊型計算的地方,NVIDIA完全可以和廠商們合作,進行新的設計。
使用這樣的計算卡,不但能用上更高速的NVLink總線通道,還能大大減小對服務器的空間佔用,而且能和CPU處理器共用散熱器。
可以看到,它的系統接口已經不是PCI-E,那是什麼?又在哪裡呢?別急……
NVLink是其中最關鍵的地方,這是NVIDIA、IBM共同設計的新型總線通道,計劃至少在某種程度上取代PCI-E,更好地支持多GPU互連,因為目前PCI-E 3.0 16GB/s的帶寬實在太窄,跟顯存動輒250GB/s+完全沒法比,未來的PCI-E 4.0也不太可能追上。
NVLink其實汲取了PCI-E的很多特性,編程方面都是一樣的,但使用了不同的信號體系,而且屬於真正的點對點設計,可以讓多顆GPU直接互連,不用再繞過PCI-E。這有點像AMDHT、Intel QPI。
NVLink的最小單元叫做『block』(區塊),每個包含八條通道,每條通道20Gbps,合計帶寬就是20GB/s,就傳輸率而言大約是20GT/s,大大超出PCI-E 3.0 8GT/s。
多個block還可以組合在一起,提供更高帶寬,或者連接更多設備。 NVLink既然要拋棄PCI-E,接口設計自然也要隨之改變,采用了夾層接口或者叫中間接口(mezzanine connector)。這東西其實並不罕見,很多擴展子卡都是這樣實現的,GeForce GTX 295的兩張PCB也是如此組裝在一起的。
這樣的接口還有個好處,那就是更高的供電效率,接口本身即可滿足供電需求,不再像PCI-E那樣插槽最大只有75W,超過了就必須用輔助接口。
NVIDIA沒有讓我們看他們的新接口具體是什麼樣子(肯定在卡的背面),但顯然需要很大的變動,必須和主板、服務器廠商一起乾。
當然了,NVIDIA自己也知道不可能完全拋棄PCI-E,NVLink的某些指令和控制通信其實還要走PCI-E,剛纔說的全新設計至少初期只能在高性能計算服務器裡看到,消費級市場甚至圖形工作站還得老老實實地用PCI-E。
NVLink要到兩年後纔會投入實用,但是已經有了更長遠的規劃,不但要在GPU-GPU之間做,還要做到GPU-CPU的互連。
剛纔就說了與IBM的合作,因為NVIDIA本身就是OpenPower聯盟的一員,IBM Power處理器就將支持NVLink,而且說不定NVIDIA自己設計的ARM架構處理器(丹佛)也會支持,但目前均未有具體計劃披露。
甚至連第二代都規劃好了。NVLink 2.0將在帕斯卡之後實現,也就是推遲的伏打,會引入緩存一致性,從而進一步提昇性能,並成為真正的異構架構。