|
||||
● 如何設計最合理的游戲GPU
設計一款出色的GPU是NVIDIA和AMD創立以來堅持了十幾年的目標,不過如何設計一款出色的游戲GPU,這的確是不小的挑戰,特別是對NVIDIA這種要用一套GPU微架構兼容高性能計算和圖形兩條產品線的廠商來說,如果偏向了一方另外一方肯定要受到嚴重影響。
2009年末NVIDIA GTC大會黃仁勛先生展示Fermi
Fermi架構最大的亮點就是GPU計算,也正因為其GPU計算方面的優勢,NVIDIA的Tesla產品線在2009年末得到了空前的飛躍式發展。Impress Watch網站知名IT評論人後藤弘茂稱NVIDIA全新Fermi架構:是以處理器為目標進行設計的。因為你在Fermi身上可以看到以前GPU上從來沒有的東西,包括更多的指令雙發射、統一的L2全局緩存、64KB的可配置式L1或者Shared Memory、大量的原子操作單元等等。
不過初期過於重視高性能計算市場而忽略了Geforce產品線,所以我們看到第一代GF100核心背負了太多本不屬於它的負擔,高溫高功耗成為用戶對它的最大印象,所以NVIDIA在千元級市場上需要一款產品來證明自己的路線還是以游戲為主線的——GF104/114架構正是在這種情況下誕生。
負荷越來越重的光柵化過程
上圖是一張游戲場景截圖,復雜的場景模型和超級精細的光影效果讓GPU不堪重負,在這種圖形處理環境中,縱然一顆GPU單元擁有再強大不過的Shader流處理器,也無法應對傳統光柵化過程對於固定單元的種種考核。所以我們看到GF100/110芯片擁有512個流處理器,而TMU等單元在應對游戲需求時略顯不足,所以NVIDIA在GF104/114核心上做出了妥協。
GF100/110與GF104/114 SM對比
雖然NVIDIA在Fermi架構誕生之時不停地強調Shader的自由度需要更強大的計算能力做支橕,但是面對目前復雜而又略顯失望的游戲編程環境,GF104/114還是做出了增加固定單元比重的決定——GF104/114單個SM的性能要強於GF100/110單個SM,同時GF104/114每個流處理器所享有的Dispatch Unit發射端、SFU超越處理器、Texture Unit紋理單元數量都提昇了25%。
總體對比而言,我們可以看到GF104/114芯片上每個SM中CUDA Core數量和Texture Unit數量均有大幅增加,這都會增加SM的3D計算能力,從而讓用戶在游戲體驗上獲得更好的效果。不過相反每個CUDA Core和Texture Unit分得的各類Cache有所減少,這應該是NVIDIA GPU架構工程師在性能、晶體管平衡取捨上得出的比例。