![]() |
||
|
Registered User
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
[GZeasy]GDC2004上Demo的R420核心時脈500MHz
正確地說是來自Rage3D論壇的消息。
GDC2004上展出的R420 sample執行CMR4, 現場人員宣稱速度為9800XT的兩倍以上。 該晶片為16pipe,時脈設定為500/500(等效1000)。 值得注意的是,目前唯一的GDDR3產品 為Samsung的500MHz GDDR3,規格為8Mx32/2ns。 因為記憶體相同,所以雙方樣品的效能都卡在這邊。 與9800XT(412/365,等效730)在效能上的差異上,大約是: 核心提升至242% 500 x 16 vs 412 x 8 = 8000Mpixels/s vs 3296Mpixel/s 頻寬提升至136% 500 x 256 vs 365 x 256 = 32GB/s vs 23.36GB/s 從Rage3D論壇看來的狀況是: Vertex Shader/Pixel Shader改善,記憶體介面改善,AA/AF效能改善。 功能面上除了 Pixel Shader 指令稍改,格式改FP32之外,應該就沒有更正了才是。 不過讓人有疑問的是繼8xRGAA之後,FSAA會不會有所提升。 唯進一步提升成12xRGAA似乎會為已經嫌小的記憶體頻寬帶來相當大的負擔。 不過至少可以預測會維持8xFSAA, 比起對手應該還是會帶來一定程度的誘因。 個人分析: 核心同樣是16pipe, 但R420的fillrate比NV40高的狀況下, R420的記憶體頻寬反而比NV40小了一點。 這樣一來,在低解析度大概也會遇到和NV40一樣, 和現有產品相比效能提升不明顯的狀況; 但是到高解析度的時候應該也會得以發揮出來。 因為核心雖然較快,但是記憶體頻寬差不多, 於是實際上可能相差不大。 不過,如果Shader較多的話,狀況會小有差異: 在使用PS2.0的時候,核心稍快的R420應該會稍勝一籌。 在使用PS3.0的時候,可能會因為PS3.0的分支效率較高, 而使得R420的優勢被NV40抵消。 在Doom3下的表現,UltraShadow2會帶來的優勢可能要等測了才知道, 不過預測上應該是會讓NV40快些。 結論: 這一代的新GPU,目前看來都是準備大量的Shader Unit 來應付未來複雜的Shader Program, 但是記憶體頻寬的發展速度已經被核心發展給凌駕了, 於是能發揮的尖峰效能便會限制在記憶體之上。 可以看到,雙方都採用了一樣的記憶體, 所以如果遊戲沒有採用複雜的Shader,雙方的核心表現都會被綁在同樣的基準線上。 如果要明顯提高效能,廠商唯有採用更高檔的記憶體.... GDDR3才剛起步,雙方這回同時採用,大概都只能一同齊步走。 反過來說,未來Shader Program大幅度成長的時候,核心的技術就會讓狀況開始改觀。 其實真正的勝負應該是在中階產品.... 對OEM廠商而言,沒有技術新意,而單純是加速產品的話, 可能會因為誘因較少,而被殺低價格....實質上ATI目前是比較吃虧的。 因此即使成本高昂,R420仍很可能會成為過渡產品。 *:ATI在Editor's Day文件上暗示其Shader Model 3.0產品即將完成,因此普遍預測R500很可能會在年內發表。 此文章於 2004-04-15 05:07 PM 被 Artx1 編輯. |
|||||||
|
|
|
Registered User
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
關於NV40,還有一個問題。
其實現在的遊戲大部分為了NV3x的Shader效能不好,都把遊戲回頭改成在NV3x底下跑PS1.1。 現在對NV40用現有遊戲測試,看起來其實某些可能有把NV40被當成PS1.1卡的狀況也說不定。 當然也不是每個都這麼嚴重;不過總之,NV40開始使用PS2.0的時候,可能還會讓一些PS1.1需要3~4個pass的狀況,改成只需要1個pass,這會進一步提高NV40的表現。 至於已經讓NV40開始跑PS2.0的遊戲,那就是沒差.... 也就是說,目前對NV40的效能評估,應該都有低估的狀況。 |
||
|
|
|
Elite Member
![]() ![]() ![]() ![]() ![]() 加入日期: Mar 2002 您的住址: 台北市
文章: 4,505
|
dynamic branching的實例可以舉一下嗎?
__________________
收到…那我就不去上課了…… GeForce3新舊Driver測試(有差嗎?) 9800SE軟改簡單教學(Catalyst+RivaTuner)。私人收藏 Magnifier.tw 2003-10-26撼訊9800XT Preview2003-11-039700Pro/9800Pro/9800XT大集合! 2004-05-28ATi強力接棒者--Radeon X800Pro !2004-06-30DX9.0c帶給了GeForceFX什麼影響?(Far Cry) 2005-01-15X800XL現身─ATI中/高階新戰將!2005-02-17剪不斷、理還亂─『CPU&顯示卡』前世今生徹底解析! 2005-06-30[G70系列之1]7800GTX真的非『最高階』CPU不可嗎? more...... |
|
|
|
Junior Member
![]() ![]() ![]() 加入日期: Dec 2001 您的住址: kaohsiung
文章: 887
|
引用:
你在指那部分啊? SHADER的dynamic branching 還是啥? 我是覺得用上SHADER的GAME OR 指令的動畫都很耗資源. = =材質檔狂大. 唉 PCI EXPRESS快來啦 |
|
|
|
|
Registered User
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
Static Branching:以程式執行前就定出的的條件來選擇程式接下來的分支。 Dynamic Branching:以程式執行到一半時得到的結果,決定程式後半部的分支。 嗯,Dynamic Branching應該是Vertex Shader 3.0的事情喔。 NVIDIA強調除了Vertex Texture Lookup,現在NV40的VS幾乎什麼事情都是免費的。 就算是Dynamic Branching 最大只有起始多2 cycle的負擔,即使是因為分支而讀取不同的Vertex Stream。 而我自己也是覺得VS大概很難變成瓶頸.... NV40有6顆,R420有6~8顆,實在是很夠用。 說起來VS除了NV31/34之外,幾乎沒成為瓶頸過。 ==== PS的話,好像就不是這麼一回事.... NV40是PS3.0,PS3.0實質上给的功能有: 1. 可以正常使用FP16/32 NV3x實質上沒辦法用FP16/32,Driver沒開 甚至連FP Texture都被關起來了,連我都想喊NVIDIA騙人。 2. 條件分支,在PS3.0還是Static Branching 條件分支寫在Shader內部的主要目的是為了節省pass數。 如果把2~3個Shader寫成一個的話, 透過對切換時間和pass數的節省, 應該就可以一定程度地提高效率。 3. 大量的數學指令和無限長度Shader 不過無限長度Shader不會在RT3D裡面看到,就當沒看到吧。 上面幾個是PS3.0的功能, 不過其實並不構成NV40"現在"拿來比較時的優勢, 所以可以先不算進來,只是有得選以後總是比較好。 ===== 實質上,我覺得現在NV40現在有兩個問題: 1. 現在有些遊戲好像還把NV40當NV35跑。 NV35因為PS2.0跑不快,遊戲廠商常常會把NV35當成PS1.1的卡來用。 而有些Shader用PS1.1來寫,有些東西會變成跑不止1個pass。 當然對NV35而言這樣(用PS1.1)還是會比用PS2.0來得快;不過對NV40就不一定了。 從ShaderMark的測試來看,單管線對比下NV40有不少case已經要來得比R300還快, 所以如果每個遊戲都很確實地在NV40上套用上PS2.0的話,NV40的成績應該還有加快的空間。 2. 現在的Driver根本不支援Shader 3.0 B3D的test想拿ixbt-labs的工具來測VS3/PS3測不起來。 如果6/1推出的Driver還沒支援的話,這次保證會再被罵騙人。 VS3/PS3我是覺得如果遊戲沒有改的話,大概就是根本沒有實質幫助。 此文章於 2004-04-15 07:59 PM 被 Artx1 編輯. |
|
|
|
|
Registered User
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
呃,關於NV40的DRAM....
從B3D forum來的,Rys對Dave那篇NV40 Review的回應: 引用:
喔喔....是GC16的ES.... |
|
|
|
|
Regular Member
![]() ![]() 加入日期: Dec 2001
文章: 85
|
引用:
ES有的是GC16,有的是GC20,不知道正式量產版會用哪顆? |
|
|
|
|
Registered User
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
有說過會用550MHz,那應該會用GC16吧。 用GC20一定會被罵死.... |
|
|
|
|
Advance Member
![]() ![]() 加入日期: Apr 2001 您的住址: 台北
文章: 395
|
照這樣看起來,NV40的PS 2.0執行效率己經可以不讓人擔心了說,到是PS 3.0效能如何,還要等相對應測試軟體出來才曉得。
![]()
__________________
我就是我!! |
|
|
|
Elite Member
![]() ![]() ![]() ![]() ![]() 加入日期: Mar 2002 您的住址: 台北市
文章: 4,505
|
引用:
如何算出NV40跑PS1.1會比PS2.0慢呢?
__________________
收到…那我就不去上課了…… GeForce3新舊Driver測試(有差嗎?) 9800SE軟改簡單教學(Catalyst+RivaTuner)。私人收藏 Magnifier.tw 2003-10-26撼訊9800XT Preview2003-11-039700Pro/9800Pro/9800XT大集合! 2004-05-28ATi強力接棒者--Radeon X800Pro !2004-06-30DX9.0c帶給了GeForceFX什麼影響?(Far Cry) 2005-01-15X800XL現身─ATI中/高階新戰將!2005-02-17剪不斷、理還亂─『CPU&顯示卡』前世今生徹底解析! 2005-06-30[G70系列之1]7800GTX真的非『最高階』CPU不可嗎? more...... |
|
|
|