PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
playgamefun
Power Member
 

加入日期: Oct 2004
文章: 594
取代CPU,史丹福大學:GPGPU具有最好的通用計算性能

Beyond3d採訪了Stanford大學的Mike Houston,討論了ATi剛剛宣佈的Folding@Home項目。Houston表示目前ATI芯片具有最好的GPGPU架構,同時他還透漏NVIDIA GPU進行通用運算的劣勢所在。
Mike Houston:所有的GPU都是SIMD,所以分支肯定會有相應的性能結果。我們仔細設計了代碼,具有很高的分支統一性。代碼嚴重依賴於shader中巨大的循環數目。對於ATi而言,循環和分支運算可以通過數學來處理。我們有很多數學計算。我們所運行的fragment shader非常接近所使用的指令順序峰值。但是,我不能說分支就是該應用實現的關鍵。我認為是X1K令人難以置信的內存系統和線程設計使得它成為了最適合GPGPU的架構。這允許我們以接近峰值的速度運行fragment引擎。
ATi所能實現而NVIDIA卻無法做到的原因是因為運行Folding代碼需要在每個fragment中動態執行許多指令。而對於NVIDIA來說,在指令大於64K後,shader終止並在Color[0]->Color[3]中以R0->3退出。所以,對於NVIDIA顯卡,我們必須執行多通道運算,這可能導致緩存崩潰並增加芯片外部帶寬要求。
另外一個對我們很重要的是ATi硬件中紋理延遲隱藏的方式。通過數學計算,我們可以消除所有紋理讀取的成本。我們可以在很寬範圍內進行海量計算,我們可以在同一內存系統中驅動更多ALU。NVIDIA則無法隱藏紋理延遲率,更重要的是,即使發出一個float4取回命令也要花費4個週期。所以NVIDIA的成本=ALU+紋理+分支,而ATi則可以將GPGPU性能發揮到最好。
另外Rage3d刊登了一些ATi顯卡GPGPU性能信息
●X1900XT運算性能為500 GFlops,相比而言Cell處理器只有220 GFlops,Core 2 Duo處理器更是只有25 GFlops。
●10000台配備X1900XT顯卡的客戶機性能相當於一台PetaFlop的超級計算機。
●目前支持X1900、X1950等級顯卡,不久後就支持X1800。
●X1900XT folding時功耗為80W,比3D運算時還少

General Purpose Computation on Graphics Processors (GPGPU)
http://news.mydrivers.com/pages/200...82812_32832.htm
     
      
舊 2006-10-01, 05:32 PM #1
回應時引用此文章
playgamefun離線中  
Yusunu
Elite Member
 
Yusunu的大頭照
 

加入日期: Sep 2006
您的住址: Mt.Ali
文章: 4,548
這說不定是AMD願意負債買下ATi的真正原因喔,
看起來ATi的技術可以拿去做很多其他事•••
 
__________________
簽名檔配備常常僅供參考,所以不列了
舊 2006-10-01, 06:08 PM #2
回應時引用此文章
Yusunu離線中  
firmware
Master Member
 
firmware的大頭照
 

加入日期: Mar 2006
您的住址: On Chip
文章: 2,202
IC技術真恐怖,ASIC已經強到可以變成general purpose了......
不過照文中所述,ATI的GPU架構似乎是很先進的

看來AMD要拿ATi的GPU當成coprocessor並非不可能呀,要是能內建在CPU中
舊 2006-10-01, 06:30 PM #3
回應時引用此文章
firmware離線中  
seaweed
Regular Member
 

加入日期: Mar 2001
文章: 76
引用:
作者firmware
IC技術真恐怖,ASIC已經強到可以變成general purpose了......
不過照文中所述,ATI的GPU架構似乎是很先進的

看來AMD要拿ATi的GPU當成coprocessor並非不可能呀,要是能內建在CPU中

這說明了ATi在效能上老是輸nVidia的原因
因為不務正業

CPU內建顯示在這3~5年內很有可能出現
AMD已經將記憶體控制器包在CPU中,也就是北橋
下一步就是將雙核心CPU空一個位置,將顯示晶片包在裡面
但效能可能不太好,初期目標應是低階市場
舊 2006-10-01, 09:42 PM #4
回應時引用此文章
seaweed離線中  
Chang JQ JQ
Master Member
 

加入日期: Jan 2002
您的住址: 桃園
文章: 2,019
讓我想到 浮點運算器
舊 2006-10-01, 09:51 PM #5
回應時引用此文章
Chang JQ JQ離線中  
Yusunu
Elite Member
 
Yusunu的大頭照
 

加入日期: Sep 2006
您的住址: Mt.Ali
文章: 4,548
引用:
作者seaweed
這說明了ATi在效能上老是輸nVidia的原因
因為不務正業

CPU內建顯示在這3~5年內很有可能出現
AMD已經將記憶體控制器包在CPU中,也就是北橋
下一步就是將雙核心CPU空一個位置,將顯示晶片包在裡面
但效能可能不太好,初期目標應是低階市場

那再下一步乾脆也把南橋包進去吧,這樣在該Socket的生命週期內,
只要換個U,就等於是換了半張主機板
我是來亂的•••
__________________
簽名檔配備常常僅供參考,所以不列了
舊 2006-10-01, 09:51 PM #6
回應時引用此文章
Yusunu離線中  
誰找我
Major Member
 
誰找我的大頭照
 

加入日期: Aug 2005
您的住址: 歡迎加入THK
文章: 161
記得ATi有開發加速影片編碼的程式,Avivo Transcode,另一個很實際的應用...
舊 2006-10-02, 01:05 AM #7
回應時引用此文章
誰找我離線中  
s2588s
Senior Member
 
s2588s的大頭照
 

加入日期: Nov 2003
您的住址: ROC
文章: 1,204
引用:
作者seaweed
這說明了ATi在效能上老是輸nVidia的原因
因為不務正業

CPU內建顯示在這3~5年內很有可能出現
AMD已經將記憶體控制器包在CPU中,也就是北橋
下一步就是將雙核心CPU空一個位置,將顯示晶片包在裡面
但效能可能不太好,初期目標應是低階市場


我想會不會就因為設計先進

結果製程良率一直上不來
__________________
期待入手
Nikkor-N Auto 28mm F2 AI改
Leica 50mm f/1.0 NOCTILUX-M 莫名其妙入手
舊 2006-10-02, 01:15 AM #8
回應時引用此文章
s2588s離線中  
lobben
Senior Member
 
lobben的大頭照
 

加入日期: Oct 2006
文章: 1,384
nVidia總是能以較低的成本搶得先機...
也許ATi 的卡在某些地方很先進 但一般user在3D game中感受不到
就算以後會慢慢感受到ATi架構的遠見 那也是以後的事
因為換顯示卡的速度太快了
能把一張顯示卡用超過三年的3D Game玩家真是太難得了
舊 2006-10-02, 01:20 AM #9
回應時引用此文章
lobben離線中  
lobben
Senior Member
 
lobben的大頭照
 

加入日期: Oct 2006
文章: 1,384
引用:
作者firmware
看來AMD要拿ATi的GPU當成coprocessor並非不可能呀,要是能內建在CPU中


AMD只要能弄個X1900XT GPU到CPU裡並能發揮效能
那Intel可能要變出40核心才追得上
舊 2006-10-02, 01:33 AM #10
回應時引用此文章
lobben離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是06:53 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。