|
"津雲"客戶端 |
|||
GCN架構的實際意義:GPU計算效能大增
最後,再來強調一下AMD拋棄5D/4D VLIW改用全新GCN架構的意義
理想狀態下毫不相乾的四組線程執行情況
在VLIW的理想情況下,4個線程分別各自獨立且毫不相關,可以看到新架構和VLIW的執行情況和類似,理論上效率都是100%。
非理想狀態下,條件相關線程延遲執行
但對於VLIW架構來說,不理想的情況就是遇到相關的指令流,比如兩個綠色線程,前三個線程可在一個周期內執行,最下方的藍色只能獨立執行。而對於新架構來說,則不存在這樣的問題。也就是說,采用硬件調度之後,GCN和SIMD可以允許選擇不同的線程亂序執行,這些線程可以來自同一任務,也可以是不同任務。當然,這種“亂序”也不是絕對的,基本的流程還是要遵守的,比如各個線程之間的指令必須按順序執行,不能打亂也不能分割。
以往的VLIW架構在並行任務處理方面處於劣勢,並且很依賴編譯器和API的支持,擴展到OpenCL也受到很大限制。經過硬件架構的調整,新的GCN架構在並行計算方面有了很大提高。編譯壓力減輕,硬件調度的加入使編譯器擺脫了調度任務;其次是程序優化和支持語言擴充更見容易;最後是不用在生成VLIW指令和相關調度信息,新架構最底層的ISA也更加簡單。