|
||||
當然,這纔是我們這次最重要的部分:為多核X86 CPU添加一個CUDA編譯器進行優化。
目前的CUDA所用的運算方法是分開的,一部分由CPU負責,而另一部分通過CUDA編譯器使用GPU進行運算。在CUDA 2.0內,可以將GPU負責的部分也交由CPU進行運算,這樣將能夠徹底利用上未來的多核CPU能力。
近期內會有一個針對CUDA 2.0的測試版出現,雖然目前還不知道其真正的水平,但看起來非常不錯。新的計劃,新的定位,不知道NVIDIA到底在想什麼。雖然現在GPU和CPU的大戰中GPU超出的部分太多,特別是有CUDA助陣,但想到不久的將來,Larrabee上市之後呢?整個情況又會發生什麼樣的變化,Intel為Larrabee配備了至少32個內核,加上和自家CPU的配合,不知道CUDA還有多大優勢。
Tesla Series 10
上個月NV剛公布了基於GT200的Tesla 2的新品,正如我們所猜測的,NVIDIA已改變了主意,凡是自己的GPU一律支持CUDA,無論是Tesla,GeForce還是Quadro,雖然,Tesla和GeForce或者Quadro都不一樣。
相對於768 MB的的GeForce 8800 GTX,Tesla的第一代產品就已經擁有1.5GB的顯存,雖然在當時優勢不是特別明顯,但是如今NVIDIA突然拿出了今年秋季纔正式推出的第10代Tesla C1060擁有了高達4GB的顯存,和GTX 280長的很像,可惜後者只有可憐的1GB顯存而已。
第十代Tesla擁有兩款產品,一個是單卡,一個是1U,1U配備了4塊上述的卡,只配備了2塊卡的『Quadro Plex』這次只能捉襟見肘了。和8代不同,10代使用了特別的PCB板,有32層,只有這樣纔能裝上4GB的顯存顆粒,顆粒為DDR3 800 MHz,提供了95.4 GB/s的帶寬。
和GTX 280不同,Tesla 10只需要一個6pin的PEG接口,這是因為Tesla 10是運算專用,一些專門用來渲染,處理3D圖像的晶體管在Tesla裡被關閉,導致功耗大幅度下降。