PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

回應
 
主題工具
roc911
Master Member
 
roc911的大頭照
 

加入日期: Jan 2004
文章: 1,518
Doom3 & NV3X的架構

NV40 in Doom3
http://big5.pconline.com.cn/b5/www....410/468626.html
(看過請見諒)
NV40的架構真的是很優良!!

另外還有NV3X架構的附加檔
都是從大陸網站找來的
不知是第幾手資料了
這兩篇都有講到nv3x架構和doom3的關係
看完後有個想法
nv3x的架構(4*2)真的是為了Doom3而設計嗎??
nv3x在doom3的確是跑得不錯m但其他的就....
這樣犧牲真是有點大耶
這是當初始料未及的嗎??
     
      

此文章於 2004-10-13 04:58 PM 被 roc911 編輯.
舊 2004-10-13, 04:56 PM #1
回應時引用此文章
roc911離線中  
Reich 唐
Golden Member
 
Reich 唐的大頭照
 

加入日期: Oct 2000
您的住址: 台北市
文章: 3,232
不過看完覺得ATi的顯示卡被綁了一隻腳在跑Doom III
 
__________________
舊 2004-10-13, 06:53 PM #2
回應時引用此文章
Reich 唐離線中  
kq13kq13
Major Member
 

加入日期: Oct 2003
文章: 196
跑3DMark05就蠻明顯的......好像只有4管的程度
舊 2004-10-13, 09:14 PM #3
回應時引用此文章
kq13kq13離線中  
aug0123
*停權中*
 

加入日期: Jan 2004
您的住址: 壞人補習班PCDVD總部
文章: 1,008
很多廠商不吃 4*2這一套...
這一點 N社也等於被綁一隻腳
舊 2004-10-14, 09:53 AM #4
回應時引用此文章
aug0123離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
其實很顯然地NV30滿滿地都是NV25的影子....
NV30就像是NV25加上FP32支援。NV35才把後面的兩個FX12換成FP16。

而且它有個討厭的地方,在於設計目標上功能 > 效能,
但是以當時的觀點來看,就算是R3x0的功能都嫌過剩,
NV30就更沒必要了。

(NV30的FP16 format已經有OepnEXR的完整實作了,只是沒有MRT不好驗證)

對OpenGL而言,因為不強制使用FP的關係,
所以Shader使用時效能沒有顯著的下降,甚至FP16使用到4個暫存器之後會下降這點,
本身其實也是可以接受的:NV4x基本上只把register file提升到兩倍,
意即NV4x使用4個以上的FP32暫存器仍然會遇到效能衝擊。

也就是說,如果適度配合使用FP16,NV3x的效能衝擊並不會糟糕到今天這個地步,
CS-Source要是透過3DAnalyzer強制使用FP16的話,效能會顯著提升這點,
證明上述文章內提到ATI影響廠商使用fp24,不使用fp16/32分離coding的問題,
實在遠比想像中要嚴重得多。
結果造成NV3x被廠商直接歸類到DX8 device,在NVIDIA現在想要推NV4x的狀況下,
其實也只能夠順水推舟....

市場決定勝敗,在此再明顯不過。
舊 2004-10-14, 02:40 PM #5
回應時引用此文章
Artx1離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
作者kq13kq13
跑3DMark05就蠻明顯的......好像只有4管的程度


其實這點是蠻明顯的,比方說我們以單管線的Pixel Shader配置來看:

NV25: (4x) Tex--FX10--FX10
NV30: (4x) FP32(Tex)--FX12--FX12
NV35: (4x) FP32(Tex)--[Mini32(FP16+FP16)]
R3x0: (8x) Tex--FP24--Mini24
NV40: (16x) FP32(Tex)--FP32

*: NV31/34 = 1/2 NV30, NV36 = 1/2 NV35

所以,從上述的管線資料,我們可以知道:

NV30 = FP32 x 1 or FP16 x 2 or FX12 x 2 x4pipe
NV35 = FP32 x 2 or FP16 x 2 or FX12 x 2 x4pipe
R3x0 = FP24 x 2~4(co-issue) x8pipe
R4x0 = FP24 x 2~4(co-issue) x16pipe
NV40 = FP32 x 2~4(co-issue) or FP16 x 3~5(co-issue + FP16 free nrm ) x16pipe

以指令數而言,
如果使用FP16的話,NV30/35還可以當成4x2來看,
如果全部強制使用FP32的話,NV30可是會變成只有4x1的悲慘情況。
而即使是NV35也會只有4x1~2(mini32並不完全可以執行所有的FP32),
NV31/34就更不用說了。
而RV350在使用FP324(DX9等價於FP32)的時候,
適當搭配co-issue的狀況下,面對NV35其實還可能有勝算。

所以,NV3x其實是以執行FP16為前提的設計。
這也可以看出晚了一年對developer的影響,
對NV3x而言是很致命的。

最後,實質上達成NV30當初宣傳規格的產品,是再過了一年後的NV43。
NV43還比NV30更接近當初NV30的宣傳規格。
當然,要是當初NVIDIA可以在預定時程上推出NV43這樣的產品,
那大家都可以去跳海了。(笑)
舊 2004-10-14, 05:31 PM #6
回應時引用此文章
Artx1離線中  


回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是02:24 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。