瀏覽單個文章
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by GPF
既然您說這是offline-rendering才用得到的東西,
那這是不是表示,
NV30/35跑PS 2.0的game永遠不會有脫胎換骨般的效能表現?
因為game不會用到如此複雜的shader。


嗯, 所以這是引導性的回答? (汗)
您希望聽到某些可以預期的答案嗎?

那, 我們朝兩個方向來推論吧.

1. 假設為架構問題....
可能的狀況是平行度不良.
目前來看, 問題可能在於CineFX(NV3x)野心太大了.
CineFX有1024個指令和架構上提供出來的大量常數暫存器....
32個? 話說DX9規格只有要求到12個吧? 總之(目前來看)實在是很不小的數字.
為了支援到這麼大的玩意兒, NV3x的實作看來是作了不少折衷, 於是平行度就受到影響了.

老實說, Shader的實作理想上應該是要不會發生啥指令互相depend的毛病,
不用去在乎何時使用什麼指令仍能全速運作, 但是NV3x看來是有這方面的問題,
效能才會出不來, 而現在看來R300系則沒有這個問題.

會出現這個問題的主因是和競爭對手之間沒有很大的技術差距
因為大家都在靠台灣晶圓廠商代工.... 結果大家都被同一個限制綁住了.

於是, 和當初3Dlabs P10 VPU一樣, 靈活度驚人換來的就是效能不振....
(P10一樣也是256bit記憶體介面啊, 但是VP980Pro卻和750XGL差不多快....)
現在的問題是, datapatch的成本現在實在越來越高了....
繼續搞多單元靈活組合的方式, 到底能有多少賺頭?
如果效能真的拉不起來的話大概就沒人用了, 不管他多有彈性....

總之, 如果是架構問題的話, 那麼下一代產品(NV4x)很可能就不會停留在這個架構下了.
這看來會與Register Combiner的狀況有差異.


2. 假設為Driver問題
不過再怎麼說上述的也是推測, 哪天某個新版Driver又沒cheat又沒耍詭雀能飛上天,
那就只好等著撿眼鏡碎片了? 總之這個只好繼續觀察看看了.

實際上還是要看NV....
舊 2003-08-29, 01:41 AM #53
回應時引用此文章
Artx1離線中