![]() |
||
Master Member
![]() ![]() ![]() ![]() 加入日期: Jan 2004
文章: 1,518
|
Doom3 & NV3X的架構
NV40 in Doom3
http://big5.pconline.com.cn/b5/www....410/468626.html (看過請見諒) NV40的架構真的是很優良!! 另外還有NV3X架構的附加檔 都是從大陸網站找來的 不知是第幾手資料了 這兩篇都有講到nv3x架構和doom3的關係 看完後有個想法 nv3x的架構(4*2)真的是為了Doom3而設計嗎?? nv3x在doom3的確是跑得不錯m但其他的就.... 這樣犧牲真是有點大耶 這是當初始料未及的嗎?? 此文章於 2004-10-13 04:58 PM 被 roc911 編輯. |
|||||||
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: Oct 2000 您的住址: 台北市
文章: 3,232
|
不過看完覺得ATi的顯示卡被綁了一隻腳在跑Doom III
![]()
__________________
![]() |
||
![]() |
![]() |
Major Member
![]() 加入日期: Oct 2003
文章: 196
|
跑3DMark05就蠻明顯的......好像只有4管的程度
|
![]() |
![]() |
*停權中*
加入日期: Jan 2004 您的住址: 壞人補習班PCDVD總部
文章: 1,008
|
很多廠商不吃 4*2這一套...
這一點 N社也等於被綁一隻腳 ![]() |
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
其實很顯然地NV30滿滿地都是NV25的影子....
NV30就像是NV25加上FP32支援。NV35才把後面的兩個FX12換成FP16。 而且它有個討厭的地方,在於設計目標上功能 > 效能, 但是以當時的觀點來看,就算是R3x0的功能都嫌過剩, NV30就更沒必要了。 (NV30的FP16 format已經有OepnEXR的完整實作了,只是沒有MRT不好驗證) 對OpenGL而言,因為不強制使用FP的關係, 所以Shader使用時效能沒有顯著的下降,甚至FP16使用到4個暫存器之後會下降這點, 本身其實也是可以接受的:NV4x基本上只把register file提升到兩倍, 意即NV4x使用4個以上的FP32暫存器仍然會遇到效能衝擊。 也就是說,如果適度配合使用FP16,NV3x的效能衝擊並不會糟糕到今天這個地步, CS-Source要是透過3DAnalyzer強制使用FP16的話,效能會顯著提升這點, 證明上述文章內提到ATI影響廠商使用fp24,不使用fp16/32分離coding的問題, 實在遠比想像中要嚴重得多。 結果造成NV3x被廠商直接歸類到DX8 device,在NVIDIA現在想要推NV4x的狀況下, 其實也只能夠順水推舟.... 市場決定勝敗,在此再明顯不過。 |
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
其實這點是蠻明顯的,比方說我們以單管線的Pixel Shader配置來看: NV25: (4x) Tex--FX10--FX10 NV30: (4x) FP32(Tex)--FX12--FX12 NV35: (4x) FP32(Tex)--[Mini32(FP16+FP16)] R3x0: (8x) Tex--FP24--Mini24 NV40: (16x) FP32(Tex)--FP32 *: NV31/34 = 1/2 NV30, NV36 = 1/2 NV35 所以,從上述的管線資料,我們可以知道: NV30 = FP32 x 1 or FP16 x 2 or FX12 x 2 x4pipe NV35 = FP32 x 2 or FP16 x 2 or FX12 x 2 x4pipe R3x0 = FP24 x 2~4(co-issue) x8pipe R4x0 = FP24 x 2~4(co-issue) x16pipe NV40 = FP32 x 2~4(co-issue) or FP16 x 3~5(co-issue + FP16 free nrm ) x16pipe 以指令數而言, 如果使用FP16的話,NV30/35還可以當成4x2來看, 如果全部強制使用FP32的話,NV30可是會變成只有4x1的悲慘情況。 而即使是NV35也會只有4x1~2(mini32並不完全可以執行所有的FP32), NV31/34就更不用說了。 而RV350在使用FP324(DX9等價於FP32)的時候, 適當搭配co-issue的狀況下,面對NV35其實還可能有勝算。 所以,NV3x其實是以執行FP16為前提的設計。 這也可以看出晚了一年對developer的影響, 對NV3x而言是很致命的。 最後,實質上達成NV30當初宣傳規格的產品,是再過了一年後的NV43。 NV43還比NV30更接近當初NV30的宣傳規格。 當然,要是當初NVIDIA可以在預定時程上推出NV43這樣的產品, 那大家都可以去跳海了。(笑) |
|
![]() |
![]() |