引用:
Originally posted by GPF
既然您說這是offline-rendering才用得到的東西,
那這是不是表示,
NV30/35跑PS 2.0的game永遠不會有脫胎換骨般的效能表現?
因為game不會用到如此複雜的shader。
|
嗯, 所以這是引導性的回答? (汗)
您希望聽到某些可以預期的答案嗎?
那, 我們朝兩個方向來推論吧.
1. 假設為架構問題....
可能的狀況是平行度不良.
目前來看, 問題可能在於CineFX(NV3x)野心太大了.
CineFX有1024個指令和架構上提供出來的大量常數暫存器....
32個? 話說DX9規格只有要求到12個吧? 總之(目前來看)實在是很不小的數字.
為了支援到這麼大的玩意兒, NV3x的實作看來是作了不少折衷, 於是平行度就受到影響了.
老實說, Shader的實作理想上應該是要不會發生啥指令互相depend的毛病,
不用去在乎何時使用什麼指令仍能全速運作, 但是NV3x看來是有這方面的問題,
效能才會出不來, 而現在看來R300系則沒有這個問題.
會出現這個問題的主因是
和競爭對手之間沒有很大的技術差距
因為大家都在靠台灣晶圓廠商代工.... 結果大家都被同一個限制綁住了.
於是, 和當初3Dlabs P10 VPU一樣, 靈活度驚人換來的就是效能不振....
(P10一樣也是256bit記憶體介面啊, 但是VP980Pro卻和750XGL差不多快....)
現在的問題是, datapatch的成本現在實在越來越高了....
繼續搞多單元靈活組合的方式, 到底能有多少賺頭?
如果效能真的拉不起來的話大概就沒人用了, 不管他多有彈性....
總之, 如果是架構問題的話, 那麼下一代產品(NV4x)很可能就不會停留在這個架構下了.
這看來會與Register Combiner的狀況有差異.
2. 假設為Driver問題
不過再怎麼說上述的也是推測, 哪天某個新版Driver又沒cheat又沒耍詭雀能飛上天,
那就只好等著撿眼鏡碎片了? 總之這個只好繼續觀察看看了.
實際上還是要看NV....