PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   ATI 4800Series運算能力跨入TeraFLOPS門檻 (https://www.pcdvd.com.tw/showthread.php?t=798278)

toyakoyo99 2008-06-08 12:58 PM

引用:
作者sxs112.tw
4850效能約9800GTX,4870約同等8800U

而GTX 280效能約兩張8800U

下一代R870..SP數量有2000個... :stupefy:


這樣短時間內還有競爭力~~

至少在GTX280還沒把弟弟們生出來的時候(衍生的中階和中高階版本)

本來想說只有480SP那ATI就沒救了,因為遊戲可能用88GTS/512MB就拿打趴

800SP還OK,只要效能有成正比成長

不過我很好奇,塞入這麼多SP,難道發電量不會暴增嗎?

還有這種架構,感覺塞入這麼多SP,造成的LATENCY會很大

可能會出現效率不彰的問題

純屬從硬體電路來做考量的話...

chlang 2008-06-08 03:23 PM

嗯. 期待這樣大家都可以玩的到 Crysis 而不用花兩三萬元在顯示卡上.

a1978 2008-06-08 03:27 PM

3780X2=9800GX2
4870把掉9800GX2
4870X2=王
:laugh:

HardCorr 2008-06-08 04:06 PM

所以之前的480sp是煙霧彈?

那46xx跟44xx還是只是240sp跟40sp嗎?

lobben 2008-06-08 05:10 PM

引用:
作者Nightmare
ATi 沒改架構的話,應該還是 4+1D,所以每週期 peak output 就是 480flops,最低就是 96flops(假設每個 cycle 都能完成一次浮點運算),但是要達到 peak,必需把要運算的資料包成剛好 4D 的形態,而 nv 自 G80 以來都是 1D ALU,不管有沒有最佳化,每週期每個 sp 就是 1flops。


NV的作法能理解,而且是用硬體解決
ATi 的則是靠軟體(compiler?) 好處是節省電路 可以塞更多SP
以後有機會慢慢變強 :laugh:
小弟去爬了一下文,但還是有一些疑問

請問4+1D中
4是代表RGBA(alpha) 或者座標XYZW
那1是代表什麼意思呢? :confused:
謝謝

竹雲公子 2008-06-08 06:16 PM

引用:
作者lobben
請問4+1D中
4是代表RGBA(alpha) 或者座標XYZW
那1是代表什麼意思呢? :confused:
謝謝

ATi的4+1D跟以前不同

簡單的說...就是要先用驅動程式把資料重組成五個五個一組

然後丟去給SP算

這五個資料不一定要有RGBA或是XYZW

可以是RRRRR或是RGGBA等等都可以

因為五個SP都是純量架構

但為什麼要說4+1D呢?

因為其中一個SP除了跟其他四個一樣能處理MADD外

還能進行sin,cos,log等特殊運算

所以會說成4+1D


這也就是為什麼在ATi的官方文件裡的SP架構圖中會有一個SP特別肥(圖片引用自Tom's Hardware)

有說錯請指正 :)

lobben 2008-06-08 08:41 PM

引用:
作者竹雲公子
ATi的4+1D跟以前不同

簡單的說...就是要先用驅動程式把資料重組成五個五個一組

然後丟去給SP算

這五個資料不一定要有RGBA或是XYZW

可以是RRRRR或是RGGBA等等都可以

因為五個SP都是純量架構

但為什麼要說4+1D呢?

因為其中一個SP除了跟其他四個一樣能處理MADD外

還能進行sin,cos,log等特殊運算

所以會說成4+1D

http://img.tomshardware.com/tw/news...s/041504011.jpg
這也就是為什麼在ATi的官方文件裡的SP架構圖中會有一個SP特別肥(圖片引用自Tom's Hardware)

有說錯請指正 :)

我是看了這篇 不過沒解決我的疑惑 (目前只找中文)

大大講得很清楚...小弟茅塞頓開 :D
謝謝大大指教
[補充]wiki上也有類似的話 所以大大應該沒說錯
Each of the first 4 stream processing units is able to retire a finished single precision floating point MAD (or ADD or MUL) instruction per clock, dot product (dp, and special cased by combining ALUs), and integer ADD.[3] The fifth unit is more complex and can additionally handle special transcendental functions such as sine and cosine.[3] Each of the 64 shader clusters can execute 6 instructions per clock cycle (peak), consisting of 5 shading instructions plus 1 branch

不過現在看來結果
用軟體來做"重組與打包"成為4+1D" 要拼過nv硬體的solution
演算法應該很關鍵 :D

題外話
有聽說過ATi R600/RV670目前疑似是用SP來做AA
造成AA效能暴跌 (29期電腦王)
那ROP不是浪費了嗎?
不知道AA這個問題 ATi這次會不會有好的solution


所有的時間均為GMT +8。 現在的時間是11:59 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。