不得不看!Geforce4技術深入分析(6)-IT浪潮-北方網
新聞 | 天津 | 民生 | 廣電 | 津抖雲 | 微視 | 讀圖 | 文娛 | 體育 | 圖事 | 理論 | 志願 | 專題 | 工作室 | 不良信息舉報
教育 | 健康 | 財經 | 地產 | 天津通 | 旅游 | 時尚 | 購物 | 汽車 | IT | 親子 | 會計 | 訪談 | 場景秀 | 發布系統

"津雲"客戶端
  您當前的位置 : 北方網  >  IT浪潮  >  廠商專區
關鍵詞:

不得不看!Geforce4技術深入分析(6)


http://www.enorth.com.cn  2002-02-17 11:09

  Lightspeed Memory Architecture II(第二代光速顯存架構)

隨著3D應用程序及多媒體程序的發展,顯卡所要應付的圖形數量及復雜度越來越高,這對於顯卡的顯存帶寬提出了前所未有的高要求。但GPU的顯存帶寬也是當今顯卡公認的瓶頸,這個問題對於擁有強勁GPU的NVDIA來說更是突出。為了解決這一突出問題,NVIDIA在GeForce4家族中應用了第二代光速顯存技術(LMA II),進一步舒緩顯存帶寬的瓶頸問題。

LMA II使用多種全新的技術提高顯存效率,這些技術包括:

Crossbar Memory Controller(交叉顯存控制器):

保證顯存系統各方面的協調工作,及時滿足GPU的請求。理論上說,NVIDIA的第二代光速顯存架構所提供的顯存帶寬可以達到一般顯存架構的2-4倍。

眾所周知,GeForce4使用128-bit DDR顯存界面,這就意味著一個顯存周期可以存取256-bit的數據。但每個象素通常包含Z和模數據,也就是說並不能一次讀取完這兩組數據,而要分開兩次讀取。就目前流行的游戲而言,三角形的大小都很小,通常只有幾個象素。以一個由Z和模數據各32bit的三角形為例,它的信息量就是32bits× 2=64bits。如果顯存控制器以256-bit的模式存取數據的話,那就意味著存取過程中有75%的顯存帶寬被浪費了。

GeForce4 GPU采用了交叉顯存控制器,GeForce4 Ti通過4個獨立的顯存控制器優化了數據存取,使顯存帶寬利用率提高了4倍。其結構框圖如下:

GeForce4 Ti交叉顯存控制界面

至於經濟版的GeForce4 MX GPU的交叉顯存控制界面則簡化為兩個獨立的顯存控制器,顯存效率也有兩倍的提高。

GeForce4 MX顯存交叉控制界面

Quad Cache(四倍高速緩存):

LMA II架構具備Cache子系統,稱為四倍高速緩存(Quad Cache)。其工作原理和CPU的Cache是相同的,可以加快RAM的存取速度。

Quad Cahce具有4個獨立的為其功能作了優化的緩衝器,分別負責原始紋理,頂點數據,材質和象素信息的存取。由於各種信息相互獨立,所以在存取過程中免除了一些不必要的工作,因而可以保證各種信息高速進入圖形管線。

下面我們以一個例子來說明其工作原理:

對於分辨率為1280×1024,16-byte讀寫周期,采用三線性過濾,每象素兩個材質的的計算,其信息量為:

1280象素/行×1024行/幀×(16bytes/象素+32bytes/象素)×2.5×2=315 MB/幀

而四倍高速緩存技術可以使每象素的信息量從32bytes降低到8bytes,結果變為157MB/幀,可以把節省下來的顯存帶寬利用到更復雜的運算上。

Lossless Z-Buffer Compression(無損Z軸壓縮):

傳統GPU對它們處理的每一個象素都要進行Z-數據的讀寫,這使得Z-Buffer成為圖形系統中顯存帶寬的最大消費者。采用了4:1的無損Z壓縮,不但使顯存帶寬得到很大節約,而且畫面質量並不會下降。這一切都歸功於LMA II的Z壓縮/解壓引擎進行實時處理。

Visibility Subsystem - Z-Occlusion Culling(可視性判別系統:Z軸封閉甄選):

有別於傳統圖形架構對所有象素進行著色的處理方法,Z挑選技術對象素在屏幕中是否可見進行判別。象素要在屏幕中顯示,就必須對其色彩和Z(深度)兩組數據進行處理。這樣對於每一個可視象素而言,GPU都必須訪問幀緩存2次,由於該技術省卻了對不可視象素的渲染,所以將本來就緊張的顯存帶寬更有效地利用到對可視象素的渲染上,大大提高了顯存利用率。由於當今圖形技術一般采用一個深度數據,所以這種技術可以節省50%以上的顯存帶寬。下一代圖形技術將會采用4個或以上的深度數據,所以顯存效率更會提高4倍以上。

顯示卡在渲染一幅3D立體場景前,判斷哪些物體被別的物體遮擋住,哪些像素和紋理是不需要渲染和填充的,從而在總體渲染時不對隱面進行操作,不僅節省了渲染管道和紋理填充的資源,並且有效的減少了隱面對顯存帶寬的佔用,進一步提高顯存帶寬的使用率。NV25在調整甄選更多得象素時佔用的內存帶寬更小,這個過程將佔用核心中的外部緩衝,而不會在內存通道中進行上述操作。

Z挑選和閉塞質詢兩種技術有效地提高了GPU的工作效率和帶寬利用率,使實際應用中的顯存利用率提高50-100% 。

  

  

編輯:張濤 太平洋電腦網
[進入IT論壇]
請您文明上網、理性發言並遵守相關規定,在注冊後發表評論。
 北方網精彩內容推薦
無標題文檔
天津民生資訊
天氣交通 天津福彩 每月影訊 二手市場
空氣質量 天津股票 廣播節目 二手房源
失物招領 股市大擂臺 天視節目 每日房價
熱點專題
北京奧運聖火傳遞和諧之旅 迎奧運 講文明 樹新風
解放思想 乾事創業 科學發展 同在一方熱土 共建美好家園
2008天津夏季達沃斯論壇 《今日股市觀察》視頻
北方網網絡相聲頻道在線收聽 2008高考招生簡章 復習衝刺
天津自然博物館館藏精品展示 2008年天津中考問題解答
帶你了解08春夏服飾流行趨勢 完美塑身 舞動肚皮舞(視頻)
C-NCAP碰撞試驗—雪佛蘭景程 特殊時期善待自己 孕期檢查
熱點新聞排行 財經 體育 娛樂 汽車 IT 時尚 健康 教育

Copyright (C) 2000-2021 Enorth.com.cn, Tianjin ENORTH NETNEWS Co.,LTD.All rights reserved
本網站由天津北方網版權所有