PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   Doom3 & NV3X的架構 (https://www.pcdvd.com.tw/showthread.php?t=397169)

roc911 2004-10-13 04:56 PM

Doom3 & NV3X的架構
 
NV40 in Doom3
http://big5.pconline.com.cn/b5/www....410/468626.html
(看過請見諒)
NV40的架構真的是很優良!!

另外還有NV3X架構的附加檔
都是從大陸網站找來的
不知是第幾手資料了
這兩篇都有講到nv3x架構和doom3的關係
看完後有個想法
nv3x的架構(4*2)真的是為了Doom3而設計嗎??
nv3x在doom3的確是跑得不錯m但其他的就....
這樣犧牲真是有點大耶
這是當初始料未及的嗎??

Reich 唐 2004-10-13 06:53 PM

不過看完覺得ATi的顯示卡被綁了一隻腳在跑Doom III :stupefy:

kq13kq13 2004-10-13 09:14 PM

跑3DMark05就蠻明顯的......好像只有4管的程度

aug0123 2004-10-14 09:53 AM

很多廠商不吃 4*2這一套...
這一點 N社也等於被綁一隻腳:D

Artx1 2004-10-14 02:40 PM

其實很顯然地NV30滿滿地都是NV25的影子....
NV30就像是NV25加上FP32支援。NV35才把後面的兩個FX12換成FP16。

而且它有個討厭的地方,在於設計目標上功能 > 效能,
但是以當時的觀點來看,就算是R3x0的功能都嫌過剩,
NV30就更沒必要了。

(NV30的FP16 format已經有OepnEXR的完整實作了,只是沒有MRT不好驗證)

對OpenGL而言,因為不強制使用FP的關係,
所以Shader使用時效能沒有顯著的下降,甚至FP16使用到4個暫存器之後會下降這點,
本身其實也是可以接受的:NV4x基本上只把register file提升到兩倍,
意即NV4x使用4個以上的FP32暫存器仍然會遇到效能衝擊。

也就是說,如果適度配合使用FP16,NV3x的效能衝擊並不會糟糕到今天這個地步,
CS-Source要是透過3DAnalyzer強制使用FP16的話,效能會顯著提升這點,
證明上述文章內提到ATI影響廠商使用fp24,不使用fp16/32分離coding的問題,
實在遠比想像中要嚴重得多。
結果造成NV3x被廠商直接歸類到DX8 device,在NVIDIA現在想要推NV4x的狀況下,
其實也只能夠順水推舟....

市場決定勝敗,在此再明顯不過。

Artx1 2004-10-14 05:31 PM

引用:
作者kq13kq13
跑3DMark05就蠻明顯的......好像只有4管的程度


其實這點是蠻明顯的,比方說我們以單管線的Pixel Shader配置來看:

NV25: (4x) Tex--FX10--FX10
NV30: (4x) FP32(Tex)--FX12--FX12
NV35: (4x) FP32(Tex)--[Mini32(FP16+FP16)]
R3x0: (8x) Tex--FP24--Mini24
NV40: (16x) FP32(Tex)--FP32

*: NV31/34 = 1/2 NV30, NV36 = 1/2 NV35

所以,從上述的管線資料,我們可以知道:

NV30 = FP32 x 1 or FP16 x 2 or FX12 x 2 x4pipe
NV35 = FP32 x 2 or FP16 x 2 or FX12 x 2 x4pipe
R3x0 = FP24 x 2~4(co-issue) x8pipe
R4x0 = FP24 x 2~4(co-issue) x16pipe
NV40 = FP32 x 2~4(co-issue) or FP16 x 3~5(co-issue + FP16 free nrm ) x16pipe

以指令數而言,
如果使用FP16的話,NV30/35還可以當成4x2來看,
如果全部強制使用FP32的話,NV30可是會變成只有4x1的悲慘情況。
而即使是NV35也會只有4x1~2(mini32並不完全可以執行所有的FP32),
NV31/34就更不用說了。
而RV350在使用FP324(DX9等價於FP32)的時候,
適當搭配co-issue的狀況下,面對NV35其實還可能有勝算。

所以,NV3x其實是以執行FP16為前提的設計。
這也可以看出晚了一年對developer的影響,
對NV3x而言是很致命的。

最後,實質上達成NV30當初宣傳規格的產品,是再過了一年後的NV43。
NV43還比NV30更接近當初NV30的宣傳規格。
當然,要是當初NVIDIA可以在預定時程上推出NV43這樣的產品,
那大家都可以去跳海了。(笑)


所有的時間均為GMT +8。 現在的時間是05:33 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。