PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
[GZeasy]GDC2004上Demo的R420核心時脈500MHz

正確地說是來自Rage3D論壇的消息。

GDC2004上展出的R420 sample執行CMR4,
現場人員宣稱速度為9800XT的兩倍以上。
該晶片為16pipe,時脈設定為500/500(等效1000)。

值得注意的是,目前唯一的GDDR3產品
為Samsung的500MHz GDDR3,規格為8Mx32/2ns。
因為記憶體相同,所以雙方樣品的效能都卡在這邊。

與9800XT(412/365,等效730)在效能上的差異上,大約是:
核心提升至242%
500 x 16 vs 412 x 8 = 8000Mpixels/s vs 3296Mpixel/s
頻寬提升至136%
500 x 256 vs 365 x 256 = 32GB/s vs 23.36GB/s

從Rage3D論壇看來的狀況是:
Vertex Shader/Pixel Shader改善,記憶體介面改善,AA/AF效能改善。
功能面上除了 Pixel Shader 指令稍改,格式改FP32之外,應該就沒有更正了才是。
不過讓人有疑問的是繼8xRGAA之後,FSAA會不會有所提升。
唯進一步提升成12xRGAA似乎會為已經嫌小的記憶體頻寬帶來相當大的負擔。
不過至少可以預測會維持8xFSAA,
比起對手應該還是會帶來一定程度的誘因。

個人分析:
核心同樣是16pipe,
但R420的fillrate比NV40高的狀況下,
R420的記憶體頻寬反而比NV40小了一點。
這樣一來,在低解析度大概也會遇到和NV40一樣,
和現有產品相比效能提升不明顯的狀況;
但是到高解析度的時候應該也會得以發揮出來。

因為核心雖然較快,但是記憶體頻寬差不多,
於是實際上可能相差不大。
不過,如果Shader較多的話,狀況會小有差異:
在使用PS2.0的時候,核心稍快的R420應該會稍勝一籌。
在使用PS3.0的時候,可能會因為PS3.0的分支效率較高,
而使得R420的優勢被NV40抵消。
在Doom3下的表現,UltraShadow2會帶來的優勢可能要等測了才知道,
不過預測上應該是會讓NV40快些。

結論:
這一代的新GPU,目前看來都是準備大量的Shader Unit
來應付未來複雜的Shader Program,
但是記憶體頻寬的發展速度已經被核心發展給凌駕了,
於是能發揮的尖峰效能便會限制在記憶體之上。

可以看到,雙方都採用了一樣的記憶體,
所以如果遊戲沒有採用複雜的Shader,雙方的核心表現都會被綁在同樣的基準線上
如果要明顯提高效能,廠商唯有採用更高檔的記憶體....
GDDR3才剛起步,雙方這回同時採用,大概都只能一同齊步走。
反過來說,未來Shader Program大幅度成長的時候,核心的技術就會讓狀況開始改觀。

其實真正的勝負應該是在中階產品....
對OEM廠商而言,沒有技術新意,而單純是加速產品的話,
可能會因為誘因較少,而被殺低價格....實質上ATI目前是比較吃虧的。
因此即使成本高昂,R420仍很可能會成為過渡產品

*:ATI在Editor's Day文件上暗示其Shader Model 3.0產品即將完成,因此普遍預測R500很可能會在年內發表。
     
      

此文章於 2004-04-15 05:07 PM 被 Artx1 編輯.
舊 2004-04-15, 04:41 PM #1
回應時引用此文章
Artx1離線中  
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
關於NV40,還有一個問題。
其實現在的遊戲大部分為了NV3x的Shader效能不好,都把遊戲回頭改成在NV3x底下跑PS1.1。
現在對NV40用現有遊戲測試,看起來其實某些可能有把NV40被當成PS1.1卡的狀況也說不定。

當然也不是每個都這麼嚴重;不過總之,NV40開始使用PS2.0的時候,可能還會讓一些PS1.1需要3~4個pass的狀況,改成只需要1個pass,這會進一步提高NV40的表現。
至於已經讓NV40開始跑PS2.0的遊戲,那就是沒差....

也就是說,目前對NV40的效能評估,應該都有低估的狀況
 
舊 2004-04-15, 05:28 PM #2
回應時引用此文章
Artx1離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
dynamic branching的實例可以舉一下嗎?
舊 2004-04-15, 06:38 PM #3
回應時引用此文章
宗毛離線中  
dolaimo
Junior Member
 
dolaimo的大頭照
 

加入日期: Dec 2001
您的住址: kaohsiung
文章: 887
引用:
Originally posted by 宗毛
dynamic branching的實例可以舉一下嗎?


你在指那部分啊? SHADER的dynamic branching 還是啥?

我是覺得用上SHADER的GAME OR 指令的動畫都很耗資源. = =材質檔狂大. 唉 PCI EXPRESS快來啦
舊 2004-04-15, 06:56 PM #4
回應時引用此文章
dolaimo離線中  
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by 宗毛
dynamic branching的實例可以舉一下嗎?

Static Branching:以程式執行前就定出的的條件來選擇程式接下來的分支。
Dynamic Branching:以程式執行到一半時得到的結果,決定程式後半部的分支。

嗯,Dynamic Branching應該是Vertex Shader 3.0的事情喔。
NVIDIA強調除了Vertex Texture Lookup,現在NV40的VS幾乎什麼事情都是免費的。
就算是Dynamic Branching 最大只有起始多2 cycle的負擔,即使是因為分支而讀取不同的Vertex Stream。

而我自己也是覺得VS大概很難變成瓶頸....
NV40有6顆,R420有6~8顆,實在是很夠用。
說起來VS除了NV31/34之外,幾乎沒成為瓶頸過。
====
PS的話,好像就不是這麼一回事....
NV40是PS3.0,PS3.0實質上给的功能有:
1. 可以正常使用FP16/32
NV3x實質上沒辦法用FP16/32,Driver沒開
甚至連FP Texture都被關起來了,連我都想喊NVIDIA騙人。
2. 條件分支,在PS3.0還是Static Branching
條件分支寫在Shader內部的主要目的是為了節省pass數。
如果把2~3個Shader寫成一個的話,
透過對切換時間和pass數的節省,
應該就可以一定程度地提高效率。
3. 大量的數學指令和無限長度Shader
不過無限長度Shader不會在RT3D裡面看到,就當沒看到吧。

上面幾個是PS3.0的功能,
不過其實並不構成NV40"現在"拿來比較時的優勢,
所以可以先不算進來,只是有得選以後總是比較好。

=====
實質上,我覺得現在NV40現在有兩個問題:

1. 現在有些遊戲好像還把NV40當NV35跑。
NV35因為PS2.0跑不快,遊戲廠商常常會把NV35當成PS1.1的卡來用。
而有些Shader用PS1.1來寫,有些東西會變成跑不止1個pass。
當然對NV35而言這樣(用PS1.1)還是會比用PS2.0來得快;不過對NV40就不一定了。
從ShaderMark的測試來看,單管線對比下NV40有不少case已經要來得比R300還快,
所以如果每個遊戲都很確實地在NV40上套用上PS2.0的話,NV40的成績應該還有加快的空間。

2. 現在的Driver根本不支援Shader 3.0
B3D的test想拿ixbt-labs的工具來測VS3/PS3測不起來。
如果6/1推出的Driver還沒支援的話,這次保證會再被罵騙人。
VS3/PS3我是覺得如果遊戲沒有改的話,大概就是根本沒有實質幫助。

此文章於 2004-04-15 07:59 PM 被 Artx1 編輯.
舊 2004-04-15, 07:26 PM #5
回應時引用此文章
Artx1離線中  
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
呃,關於NV40的DRAM....
從B3D forum來的,Rys對Dave那篇NV40 Review的回應:

引用:
The memory isn't overclocked 500MHz GDDR3, it's underclocked 600MHz.

http://img.hexus.net/v2/graphics_ca...mages/drams.jpg

It's their GC16 part

http://www.samsung.com/Products/Sem.../K4J55323QF.htm


喔喔....是GC16的ES....
舊 2004-04-15, 08:33 PM #6
回應時引用此文章
Artx1離線中  
Wanderer
Regular Member
 

加入日期: Dec 2001
文章: 85
引用:
Originally posted by Artx1
呃,關於NV40的DRAM....
從B3D forum來的,Rys對Dave那篇NV40 Review的回應:



喔喔....是GC16的ES....


ES有的是GC16,有的是GC20,不知道正式量產版會用哪顆?
舊 2004-04-15, 09:13 PM #7
回應時引用此文章
Wanderer離線中  
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by Wanderer
ES有的是GC16,有的是GC20,不知道正式量產版會用哪顆?


有說過會用550MHz,那應該會用GC16吧。
用GC20一定會被罵死....
舊 2004-04-15, 09:30 PM #8
回應時引用此文章
Artx1離線中  
NONO72324
Advance Member
 
NONO72324的大頭照
 

加入日期: Apr 2001
您的住址: 台北
文章: 395
照這樣看起來,NV40的PS 2.0執行效率己經可以不讓人擔心了說,到是PS 3.0效能如何,還要等相對應測試軟體出來才曉得。
__________________
我就是我!!
舊 2004-04-15, 10:05 PM #9
回應時引用此文章
NONO72324離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
引用:
Originally posted by Artx1
[恕刪]1. 現在有些遊戲好像還把NV40當NV35跑。
NV35因為PS2.0跑不快,遊戲廠商常常會把NV35當成PS1.1的卡來用。
而有些Shader用PS1.1來寫,有些東西會變成跑不止1個pass。
當然對NV35而言這樣(用PS1.1)還是會比用PS2.0來得快;不過對NV40就不一定了。
從ShaderMark的測試來看,單管線對比下NV40有不少case已經要來得比R300還快,
所以如果每個遊戲都很確實地在NV40上套用上PS2.0的話,NV40的成績應該還有加快的空間。

2. 現在的Driver根本不支援Shader 3.0
B3D的test想拿ixbt-labs的工具來測VS3/PS3測不起來。
如果6/1推出的Driver還沒支援的話,這次保證會再被罵騙人。
VS3/PS3我是覺得如果遊戲沒有改的話,大概就是根本沒有實質幫助。


如何算出NV40跑PS1.1會比PS2.0慢呢?
舊 2004-04-15, 11:05 PM #10
回應時引用此文章
宗毛離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是07:01 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2026。