PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   NV35效能走漏?? (https://www.pcdvd.com.tw/showthread.php?t=207536)

giligula 2003-05-12 05:40 PM

引用:
Originally posted by Artx1
當然不太可能大部分的指令都有這種本事, 不然ATi的工程師絕對會洛陽紙貴家家都來挖.
當初測試用的Shader如下:

ps_1_1

def c0, 0.5, 0.25, 0.3, 0.4
def c1, 0.1, 0.2, 0.3, 0.2

tex t0

mov r1, c1
mad r0, v0, c0, r1
mad r0, r0, c1, r0
mul r0, r0, t0

我覺得可能是第一個mov有被optimize過.
所以跑出來只有3.2 cycles; 相對的當初在NV25上頭跑就是很規規矩矩的2cycles.
GF4每管線2Shaders,所以4指令2cycles理所當然; R300是每管線1Shader, 所以理應跑4cycles, 所以可以看出有optimize.

這四個指令都是屬於 arithmetic
但一個程式碼屬於 scalar operation
第二個程式碼屬於 vector operation
R300 有一組平行的 scalar 和 vector pipe
能讓第一個和第二個可以同時執行

The 3rd Truth 2003-05-12 06:13 PM

給等不及的人參考一下, 偷跑的測試結果:

They have compared the FX 5900 ultra 256MB with ATI Radeon 9700 Pro 128MB.

CPU: AMD 2700XP+

In 3DMark2001SE
Setting: Default
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/15178/14667
1280/13508/12481
1600/11874/10556

Setting: 4xAA and 8x AF
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/11714/9692
1280/9682/7316
1600/7643/5592

UT2k3 - HardOCP High Quality - Antalus
Setting: No AA, No AF
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/166.77/162.57
1280/150.6/117.8
1600/115.73/82.75

Setting: 4xAA and 8x Anisotropic Filtering
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/119.48/89.33
1280/79.41/58.83
1600/47.69/40.16

http://www.nvnews.net/vbulletin/sho...?threadid=11623

samsung 2003-05-12 06:31 PM

引用:
Originally posted by The 3rd Truth
給等不及的人參考一下, 偷跑的測試結果:

They have compared the FX 5900 ultra 256MB with ATI Radeon 9700 Pro 128MB.

CPU: AMD 2700XP+

In 3DMark2001SE
Setting: Default
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/15178/14667
1280/13508/12481
1600/11874/10556

Setting: 4xAA and 8x AF
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/11714/9692
1280/9682/7316
1600/7643/5592

UT2k3 - HardOCP High Quality - Antalus
Setting: No AA, No AF
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/166.77/162.57
1280/150.6/117.8
1600/115.73/82.75

Setting: 4xAA and 8x Anisotropic Filtering
Resolution/FX 5900 Ultra/Radeon 9700 Pro
1024/119.48/89.33
1280/79.41/58.83
1600/47.69/40.16

http://www.nvnews.net/vbulletin/sho...?threadid=11623


就我所說的在2個月以內,R350+ 即將出現

0220 2003-05-12 06:44 PM

引用:
Originally posted by samsung
就我所說的在2個月以內,R350+ 即將出現


請問Samsung大.....R350+是不是就是.13的R350呢?
或者說R350+是不是就是R390/R420呢?:confused:

Artx1 2003-05-12 06:55 PM

引用:
Originally posted by giligula
補充一下
R300 一個管線最多能在一個週期同時處理三個 shader 指令
四個指令跑了 3.2 cycle
程式碼的編排還有進步空間



嗯.... 所以是架構問題....

samsung 2003-05-12 07:00 PM

引用:
Originally posted by 0220
請問Samsung大.....R350+是不是就是.13的R350呢?
或者說R350+是不是就是R390/R420呢?:confused:


R350+是0.15製程的R350

Artx1 2003-05-12 07:16 PM

引用:
Originally posted by bluesystem
嗯~我是覺得啦,主流遊戲跟娛樂性3D加速晶片會要求到1280*1024以上的可能性
並不高,倒也不用想得太多.CRT顯示器是否能夠支援到像1600*1200這麼高的解析度其實都蠻難說,LCD就更不用講了.真的要開那麼高解析度那就只能放棄效能了.其實我認為要搞個這麼大的eDRAM,應該也是拿來做frame buffer才是.PS2因為這4MB的eDRAM佔了不少便宜(不過成也這4MB,敗也這4MB....).
我是覺得用16MB eRAM,風險會不會太高了點?!

off-screen的應用也很重要,real-time cubemap environment map,shadow map等等不能隨心所欲的用,跟video memory的速度不夠快也有蠻大的關係.RT shadow map可以用到1k*1k?有那麼幸福的事??

另外請教一點,何謂Z3??感覺Z Buffer技術的延伸應用?!


會不會加速到 1280*1024 這個問題, 現在不會以後可能會啊, 別忘了HDTV的解析度是1280x960(D3)和1920*1080(D4), 以後的GPU可能還是得面對這麼大的解析度. 不過那應該會是一段時間以後的事情了, 那時候的技術能不能支持這種設計(16MB eDRAM)就得看看了, 風險能壓到一定程度以下就會採用, 當然至少得等個兩年就是了 (兩年可能還太樂觀), 畢竟一來沒有這種排場要在這麼高的解析度下可能很難快得起來, 相對地快不起來的話也很難有能讓消費者去接受的遊戲品質.

如果能有高速的eDRAM的話, "或許"可以當成off-screen buffer來用, 1k*1k 的 RT Shadow Map 算是一種很可怕的數字了, 畢竟我是在替eDRAM的採用找理由. :p 我的確認為短期內不會有哪個實作採用eDRAM.

另, 所謂 Z3 是一種FSAA的實作方法, 指在一個 pixel 裡面只存放三個三角面的資料的方法(但可以有十六個 subsamples), 因此,可以在只有三倍負擔的情形下,達到 16X FSAA 的效果; 而且它還可以擴充. 當然,如果一個 pixel 裡面有很多個三角面就會有問題,可是通常這種情形很少見,而且就算偶而出現,也不會有太大的困擾; 事實上 Z3 主要也是從 A-buffer 而來,但是動了一些手腳,以減少所需要的資料量.

http://research.compaq.com/wrl/peop...Z3/Z3slides.ppt

orinsinal 2003-05-12 07:45 PM

引用:
Originally posted by Artx1

先前曾經傳說R350把32bit FP給補了進去, 不過看起來仍然是內部24bit浮點, 輸出對齊32bit.
以現在的製程技術而言, 32bit浮點(RGBA總合128bit)可是非常可怕的電晶體數, 為了成本理由誰都會想躲, nVIDIA真的拿出16bit/32bit浮點(還是IEEE754)出來當初嚇到了不少人, 結果果然跑不快, 拖到現在NV35才可能有解決; 當然強勢的指令集依舊.
不過, 32bit FP不管搭配哪一版Driver都沒開起來過.
說到DX10的 General Shader, 其實我搞不太清楚為什麼這兩個要合在一起?
OGL2也不打算把Vertex和Fragment合在一起啊.
當然整條管線維持同等精確度很重要就是了.(比如表示範圍統一)

你看到我的簽名檔案就聯想到某大濕,我是認為他這句話蠻棒的也拿來用...
看來被誤認了.....:)
=
原來nv30從來沒有辦法"開啟"32Bit FP過,那之前許多硬體網站評論43.03等
幾個比較低分的驅動是因為浮點精度差異的講法就有點違背了....:)
個人感覺Nvidia驅動程式似乎還沒有應用一些nv30的特色,以及你所講的強勢指令集等
不知道50.xx以後是否能順利應用這些功能來反應在效能方面

nvidia揮霍一堆電路成本去作那些不知道多久後才會有初步應用的硬體特色於nv30
外加不成熟的GDDRII的搭配(這東西絕對不會比256bit DDR來的好)
怎麼看nv30都像是個實驗產品。
娛樂用顯示卡需要的是"效能至上",太多前瞻性的設計不會增加優勢
反而會成為製程上的阻礙

之前預想nv30實作GDDRII要為了往後產品鋪路,因為DDRII有些DDR未有的電氣方面優點
結果nv40以後才有可能再度實作.....
這還是印證了〝nVidia的產品隔代買就對了〞的講法
Geforce2、Geforce4、FX5900都是完善的產品。
==
順帶一提,專業繪圖評測上,nv30系列(不是說Quadro)成績都還不錯

bluesystem 2003-05-13 09:52 AM

引用:
Originally posted by Artx1
另, 所謂 Z3 是一種FSAA的實作方法, 指在一個 pixel 裡面只存放三個三角面的資料的方法(但可以有十六個 subsamples), 因此,可以在只有三倍負擔的情形下,達到 16X FSAA 的效果; 而且它還可以擴充. 當然,如果一個 pixel 裡面有很多個三角面就會有問題,可是通常這種情形很少見,而且就算偶而出現,也不會有太大的困擾; 事實上 Z3 主要也是從 A-buffer 而來,但是動了一些手腳,以減少所需要的資料量.

http://research.compaq.com/wrl/peop...Z3/Z3slides.ppt


我在po完上一篇文章之後有找到有關Antialiasing的論文有講到Z3,大概稍微
看了一下還沒很用心看所以還一知半解.只知道好處還不少,透明物件可以不
干擾但記憶體使用又比A-Buffer少.不知道會有硬體實作嗎?

啊!剛剛看到您貼的那個網址,每個使用這個技術的硬體要收美金25塊.....:jolin:

bluesystem 2003-05-13 09:57 AM

引用:
Originally posted by orinsinal
[B]
這還是印證了〝nVidia的產品隔代買就對了〞的講法
Geforce2、Geforce4、FX5900都是完善的產品。


這個說法我十分贊同......NV的東西隔代買就沒錯.
我就是這樣做的.


所有的時間均為GMT +8。 現在的時間是09:21 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2026。