PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by BorgMu
奇怪?? 何時 GC的多邊型變最高了??
以前查到的資料還是以X-BOX為最高多邊型產生率的耶.......GC是落後X-BOX但領先PS2的??
但是GC的強項是在開反鋸齒上 (GC的玩家一向強調它的畫質,沒幾個強掉它的"效能"....X-BOX正好相反)


....GC的玩家會強調畫質嗎?
我反而比較常聽到XBox的玩家在強調畫質....

GC的T&L比較強, 可以從polygon rate比較穩定這點看得出來.
而GC目前的遊戲光源數都不少....
     
      
舊 2003-08-28, 02:45 AM #41
回應時引用此文章
Artx1離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
另外一個有趣的說法.

http://www.beyond3d.com/forum/viewt...t=7543&start=33

這篇文章是B3D的TR:AOD測試文章的其中一篇迴響.
其中提到了在關閉了post-processing effect後, 出現了頗明顯的效能差距.

Disabling the glow, heat wave and DoF effects results in a B3D-level 1024 x 768 test result jump from 24.7 fps to 67.3 fps (and note that all the other PS2.0 shaders are still active).

個人覺得是一個很值得注意的現象....
如果是PS效能不彰的話, 應該會讓整體的shader效能下降很多, 而不是有特定的shader effect造成這麼大的落差才是?
 
舊 2003-08-28, 03:03 AM #42
回應時引用此文章
Artx1離線中  
SKAP
*停權中*
 
SKAP的大頭照
 

加入日期: Jun 2003
您的住址: 台北市
文章: 2,000
其實GC某種層面上來說是很強的.只是老任的政策使他不夠亮眼

1.低價 2.不賠錢賣 3.不放出理論多邊形數量

GC採用1T-SRAM.這可是接近SRAM的東西.比RDRAM和DDR還要好非常多
只是非常貴...所以GC只搭載28MB...(外部24MB.內部2+2MB)

GC的CPU浮點運算高達10.5G...三台主機之最

目前3台家用主機其實性能接近.不會有過大的差距.所以RAM大的比較吃香(XBOX)

再此另外澄清一點.D2-D4輸出在家用主機上其實都只是記憶體問題
因為很少有廠商特別針對高解析度作高解析貼圖.因此單純提高解析度的話.只要RAM夠大就允許...
PS2只有4MB快取.所以很吃力.加到6MB或8MB的話.480P遊戲滿天飛

反正目前是RAM大吃香的啦...600萬和1200萬的多邊形很難看出明顯的差距(數不出來)
但是24MB(GC).32MB(PS2)和64MB(XBOX)的貼圖我相信很容易看出差距...

此文章於 2003-08-28 03:41 AM 被 SKAP 編輯.
舊 2003-08-28, 03:37 AM #43
回應時引用此文章
SKAP離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
引用:
Originally posted by Artx1
基本上我的意見和kkcity59兄的看法相同, 不過有些地方要跟著列近來討論一下就是了.

話說nVIDIA系的GPU(不含GF256)的產品TMU的讀取能力似乎一直維持在4texels/cycle,
於是在NV3x之前(不含NV10), AF的速度就幾乎是與AF階數相關.
比如說, 1:2 AF + bilinear MIP map, 在single mapping下總共需要16texels,
於是每個pixel就需要2個cycle才能完成. 話說NV30的TMU也維持與過去同樣的水準,
只是加入了新的AF演算法, 讓它不需要每個pixel都處理這麼多的texel.
不過這個演算法品質下降得有點明顯, 算是一個不好的折衷.

相比之下, R300的TMU效率其實應該也差不多, 只是它的AF演算法比較好一點.
讓它不需要讀取那麼多的texel, 進而達到了比較好的AF速度.

AF有兩個重點, 一個是sampling points, 一個是MIPMAP LOD的選擇.
比起R200來說, R300的 MIPMAP LOD的選擇改善很多, R200有在水平與垂直時效果最好,
在45度的時候則完全沒有效果; R300則讓AF的有效角度改為45度的倍數,
而使得最佳角度變成八個角度; 當然失效角度也跟著改變了.

說起來, R300的AF效率和R200比起來稍微有點下降....
當然這是同時脈下相對性的比較, 因為晶片的時脈也提高了, 於是R300比起R200絕對效率是有提高的.

比較之下, nVIDIA的AF實作上, NV2x的AF演算法的演算法品質非常好, MIPMAP LOD非常接近最好的選擇,
只是patten的選擇則就很糟糕, 進而讓效率變得很慘....於是很多人認為NV2x的"高品質AF"是不實用的, 即使效果很好.
NV3x的狀況則如同前述, 有一個新的AF模式但是效果不好. 跑舊有模式的時候則和過去NV2x一樣慢.
ATi 的patten選擇則好得多, 於是就反映在效能上.

理想上, 應該是要追求處理最少的texels而達到最好的效果, 只是目前的硬體實作還做不出一些比較複雜的演算法就是了.
總結上而言, 普遍上認為目前R300的AF是一個比較好的折衷, 不過ATi應該可以企圖去提供品質更好的AF就是了; 而nVIDIA需要引進一個更好的patten, 才能改善AF的效能表現.


呵呵,有點離題了
不過ATi對AF的優化除了"較折衷"的取樣方法外還多了這個:
http://www.3dcenter.org/artikel/ati...en/index6_e.php
引用:

…More precisely, with ATi's anisotropic filter only the basis texture (texture stage 0) is filtered trilinear, whereas all other textures (texture stages 2-7(註)) are only bilinear filtered. This behavior of the ATi driver thereby applies to all applications using the anisotropic mode.…
(註:原意應該是texture stages 1-7)

根據我自己的測試,(應用程式喜好和用CP設定)效能增益大約是5~10%不等
--
至於上次ut2003 ati的問題這篇review也解釋得很清楚了

well,繼續PS 2.0吧
舊 2003-08-28, 03:43 AM #44
回應時引用此文章
宗毛離線中  
Minos
*停權中*
 
Minos的大頭照
 

加入日期: Sep 2002
您的住址: 總部
文章: 684
引用:
Originally posted by SKAP
其實GC某種層面上來說是很強的.只是老任的政策使他不夠亮眼

1.低價 2.不賠錢賣 3.不放出理論多邊形數量

GC採用1T-SRAM.這可是接近SRAM的東西.比RDRAM和DDR還要好非常多
只是非常貴...所以GC只搭載28MB...(外部24MB.內部2+2MB)

GC的CPU浮點運算高達10.5G...三台主機之最

目前3台家用主機其實性能接近.不會有過大的差距.所以RAM大的比較吃香(XBOX)

再此另外澄清一點.D2-D4輸出在家用主機上其實都只是記憶體問題
因為很少有廠商特別針對高解析度作高解析貼圖.因此單純提高解析度的話.只要RAM夠大就允許...
PS2只有4MB快取.所以很吃力.加到6MB或8MB的話.480P遊戲滿天飛

反正目前是RAM大吃香的啦...600萬和1200萬的多邊形很難看出明顯的差距(數不出來)
但是24MB(GC).32MB(PS2)和64MB(XBOX)的貼圖我相信很容易看出差距...


嗯嗯~說的好...推!
最近的新聞是這樣的~
XBOX2 跳 ATI...
GC2? 同 ATI...
PS3 投 Nvidia...
舊 2003-08-28, 04:17 AM #45
回應時引用此文章
Minos離線中  
GPF
Senior Member
 
GPF的大頭照
 

加入日期: Nov 2001
文章: 1,397
引用:
Originally posted by Artx1
如果是PS效能不彰的話, 應該會讓整體的shader效能下降很多, 而不是有特定的shader effect造成這麼大的落差才是?

不太懂....

請看hardocp的測試,
http://www.hardocp.com/article.html?art=NDM5LDk=
測試結果幾乎是一面倒,
難道這還不足以證明NV30/35 PS 2.0 效能不佳?
舊 2003-08-28, 07:28 AM #46
回應時引用此文章
GPF離線中  
GPF
Senior Member
 
GPF的大頭照
 

加入日期: Nov 2001
文章: 1,397
引用:
Originally posted by Artx1
總之, 我是覺得會想期待一下NV3x在高度複雜度的Shader下能不能有更好的表現;
而我會覺得R300/350的高速可能不容易在高度複雜的Shader下發揮出來.
當然現在的高速仍然有目共睹就是. 這邊也聽過R300系應該比較能夠發揮出一般對DX9效能上的期望.

請教一下何謂高度複雜度的shader?
3DMark03 GT4,3DMark2001 GT4還不夠複雜呀?

還有...
使用更多register複雜度不算更高嗎?

如您所說,
"NV30/35用到某個數目以上的register之後降速會降得很厲害"...

如果是的話,那您為何還期望NV30/35在高複雜度的shader下面反而比較能發揮出來呢?小弟不太能明瞭...
舊 2003-08-28, 07:37 AM #47
回應時引用此文章
GPF離線中  
giligula
Major Member
 

加入日期: Dec 2002
文章: 156
引用:
Originally posted by SKAP
抱歉...你們再討論什麼我不是很清楚啦...不過這一句

"連效能普普的 GameCube Flipper 都能做到 trilinear 不會有任何 fillrate loss 了"

GC的Flipper效能普普?是和什麼比呢?

Flipper的多邊形比XBOX的NV2A還高的說.還有8道硬體光源說...我不覺得差啊

·Estimated raw display capability:
NGC:162.0 million polygons per second
XBOX:116.5 million polygons per second
PS2:84.26 million polygons per second

那是謠言
從任天堂本身的 NGC documentation
20M polygons/second->1 vertex color + 1 light + 1 texture
27M polygons/second->no vertex color + 1 texture
32M polygons/second->1 vertex color + no texture

NGC 的強項在性能容易穩定發揮
舊 2003-08-28, 08:46 AM #48
回應時引用此文章
giligula離線中  
giligula
Major Member
 

加入日期: Dec 2002
文章: 156
引用:
Originally posted by Artx1
另外一個有趣的說法.

http://www.beyond3d.com/forum/viewt...t=7543&start=33

這篇文章是B3D的TR:AOD測試文章的其中一篇迴響.
其中提到了在關閉了post-processing effect後, 出現了頗明顯的效能差距.

Disabling the glow, heat wave and DoF effects results in a B3D-level 1024 x 768 test result jump from 24.7 fps to 67.3 fps (and note that all the other PS2.0 shaders are still active).

個人覺得是一個很值得注意的現象....
如果是PS效能不彰的話, 應該會讓整體的shader效能下降很多, 而不是有特定的shader effect造成這麼大的落差才是?

post processing 也許是衝到硬體的架構
也有可能是驅動程式的問題
很難說
只有 NV 曉得

這種事在以前都是發生在 ATI 身上
像 Simcity4 的 culling technique 衝到 R3x0 的記憶體處理架構
Neverwinter Nights 開 shadow 後效能降得不像話
不過 ATI 後來都有與開發商共同解決問題
照開發時程
Core-Desing 在製作 ps2.0 時應是以 ATI 的卡為準
NV 應該也會在之後解決 post processing 的問題
只是
不管有沒有 post processing
用 Cg compiler 依舊效能不敵 9700Pro(不是 9800)
而且用 Cg compiler 出來的 shader code
在不開 FSAA
甚至比 DirectX 內建的 compiler 效能還差一點點

FX 的內部架構較之前有很大不同
概念很好
也許是首次嚐試
似乎電路實作上
仍存在著缺陷
讓 driver team 搞了那麼久
還是搞不定

Xbit labs 有一篇 Cg plugin 效能的文章
http://www.xbitlabs.com/articles/vi...splay/cgfx.html
有 DirectX8 和 DirectX9 的 shader 版本比較
雖然 render 出來的畫面差不多
不過 DX9 用 register 和複雜度是多得多
舊 2003-08-28, 10:25 AM #49
回應時引用此文章
giligula離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by GPF
請教一下何謂高度複雜度的shader?
3DMark03 GT4,3DMark2001 GT4還不夠複雜呀?

還有...
使用更多register複雜度不算更高嗎?

如您所說,
"NV30/35用到某個數目以上的register之後降速會降得很厲害"...

如果是的話,那您為何還期望NV30/35在高複雜度的shader下面反而比較能發揮出來呢?小弟不太能明瞭...


嗯, 這樣講好了.

為了幫助RT Rendering, 目前使用的Pixel Shader長度也還沒有長到超過R300系的
內部PS cache(160指令), 不過R300沒有F-Buffer沒辦法使用超出指令長度的東西,
所以基本上還不算是高複雜度, 當然這是offline-rendering才用得到的東西, RT3D現在還不實用....

不過也有一個疑問是, R300系是不是就是因為Pixel Shader指令存放在晶片內部cache才會比較快呢?

-----
至於使用更多的register會降速的部分, 這部分我也不太明瞭.
但是從nVIDIA的David Kirk先生的談話, 其實是稍微可以揣測一下:

nVIDIA強調, NV3x是一個"virtual pipeline", 並不是四個可以改變部分處理能量的管線並列,
而是一個較大的資料流水線, 只是每個stage的處理能量都有點不同(可能是4個~8個), 並非原來一個一個pixel接力運作的設計, 於是stage間會有微妙的depend;
而目前R300的Pipeline, 各個管線的Pixel Shader都是獨立運作的, 彼此之間沒有depend.

所以, Uttar(NFI-GPU:RW的站長)當初的文章認為, 如果減少同時使用的register, 相對地拉長Shader長度的話, NV3x的表現會有所不同.

當然, 光是透過Register access的調配, 要透過"增加10%的程式碼增加個40%的效能"似乎是有點誇張了.

總之, 我是想關心NV3x"為什麼這麼慢"....
舊 2003-08-28, 10:38 AM #50
回應時引用此文章
Artx1離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是11:25 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。