|
||||
Intel低調的開始利用它的Larrabee進入圖形芯片市場。對此,NVIDIA並沒有大肆批評虛無的Larrabee,也只是偶爾低調地回應。不過,隨著這幾個月來我們所看到的回回的互諷。Intel Larrabee GPU的核心架構終於第一次出現在了大眾眼前。
當然很重要的一點就是要謹記,這不是一個GPU但又確確實實是GPU。此時讀者肯定會想,它和一個數據平行處理優化的多核CPU有什麼區別呢?有一個微妙的固定功能硬件來盡可能簡單地運轉一般的編碼。Intel可以制造這個應用廣泛的多核CPU,使它看起來像通過執行軟件程序庫來處理DirectX和OpenGL的GPU。
這不是一個仿真GPU,因為它直接在數據平行的CPU上執行函數性,而這種CPU一般在專門的硬件上操作。開發者們也都不會僅僅局限於DirectX和OpenGL,這類硬件可以操作純粹的渲染程序並運作,如同量身定做一般。
英特爾可以建立一個圖形處理器嗎?Larrabee以現存的Intel x86的核心技術為基礎制作出來的,這不僅意味著Intel對芯片設計熟之又熟,而且對以後的桌面微處理器會采取更認真的方式。但是Larrabee並不是在酷叡架構---Intel現有的所需----基礎上制造出來的,而是基於最初的Pentium。
最初的Pentium是在0.80μm的處理器上制作而成的,之後提昇為0.60μm. Intel的問題就是:擁有現代處理以及廣泛的向量組裝備的Pentium酷叡的更新版,可以成為終極GPU嗎?
首先來檢測一下Intel理論的標准Core 2 Duo,4MB L2緩存頻率(可能有些地方在1.8-2.9GHz之間).然後,在同一制作過程當中,大致相同的死機區域,以及動量消耗,Intel試圖找到有多少這種修正過的Pentium cores它可以適合。
因此,在空間的雙核心Core 2 Duo處理器,英特爾可以興建這個假設性的10核心芯片。下面我們先來看看這些數據:
Intel Core 2 Duo | Hypothetical Larrabee | |
# of CPU Cores | 2 out of order | 10 in-order |
Instructions per Issue | 4 per clock | 2 per clock |
VPU Lanes per Core | 4-wide SSE | 16-wide |
L2 Cache Size | 4MB | 4MB |
Single-Stream Throughput | 4 per clock | 2 per clock |
Vector Throughput | 8 per clock | 160 per clock |
larrabee核心:不完全是Pentium,也不完全是Atom