PCDVD數位科技討論區 - 瀏覽單個文章 - Nvidia 玩古墓奇兵6 效率比 ATi差那麼多！

引用:

Originally posted by GPF
錯，
看來你根本沒看文章內容。
FX系列會被R300/R350狂電的原因是因為PS 2.0效率不佳。

The lower end boards display similar tendencies, with the ATI boards showing quite a higher performance than the NVIDIA boards, which is almost certainly due to the PS2.0 shader use within the game.

只開Triliner Filtering時(AF off)，
NV30/35一樣被狂電。(請看最上面那張圖)

http://www.beyond3d.com/misc/traod_...f/index.php?p=3

您好,測試小弟看了,只是沒有完全把他的話全信,雖然小弟對顯示晶片本來不內行
但是對於網路上眾多測試,仍然會持保留一點的意見,要是跟小弟原本觀念有些衝突
就還是會互相斟酌的,若您是這方面高手,還請您多多指教指教

我提供我的看法,基本上我認為,AF跟Trilinear發生的瓶頸是一樣的
我只指出AF的問題,因為我把Trilinear看成一種AF處理,假如不是這樣
就請您說明一下,例如以1:2 AF,每個貼圖需八個texels,這與trilinear情形相同
假如GPU可以fetch 8 texel/cycle,他可以得到幾乎免費的AF或Trilinear
但是假如是1:8的AF_Mipmaps,texels需要64個,這時的fillrate就可能是瓶頸
(通常這時候的memory bus都還可以撐得住,這是與AA有一些不同的)
以Geforce來看,他長期的AF效率都是不好,一個原因是他很多晶片
打開AF時,fillrate會減半,NV30若沒有改進,則AF效率會大不如R300
事實上目前所有的測試,也都指出來NV3X仍然有這樣的問題
就算這一篇測試報告,也反映出同樣的問題

再來說Pixel Shader,以R300來說,他有8gFLOPs/cycle,以300mhz的R300
可以得到19.2gFLOPs,問題在於NV3X宣稱52gFLOPs
(我不確定這是同時加上的Vertex Shader的總和?)
以ati來看,他一個時脈可以處理一個mad指令,等於是8 texels,假如nvidia效率一樣
這樣他會比ati快得多。但是我們可以猜想,從以前NV 2x的例子,他只有一半效率
切一半的NV30仍然有比R300快一點的。
事實上PS的運作是更複雜,所以需要更多實驗來驗證他的效率
好比pixel shader越來越長,得藉助Local buffer來存放,這樣要如何保持效率?
只是廠商的宣稱值自然可能灌水.沒有實驗下,我會先不質疑這樣的說法
但因為AF是長久以來Nvidia的問題,我會把這篇測試仍舊導向這樣的結論
而不直接做出PS 2.0效率不彰的結論。
因為光從這篇測試,這樣的結論我覺得太快了
我們不是光講數據,這樣影響的變因太多了,事實上這篇報告也沒有固定眾多變因
所以總得講點道理來解釋,才會比較科學

要用這篇測試,AF跟Trilinear的fillrate效率,要推導出PS 2.0效率不彰的邏輯
小弟還是不很能接受,還盼您釋疑,謝謝