瀏覽單個文章
jasonyang
Major Member
 

加入日期: Sep 2004
您的住址: 木柵動物園
文章: 293
引用:
作者SuperAoi
就我知道intel的浮點運算勝過amd
所以適合3d製作人員
但amd在玩game似乎又勝過intel
想請問intel與amd各有那些優勢與劣勢呢?
虛心請教只是想多了解二者的差異
請各位高手幫忙解答,謝謝!!


我想前面已經很多人已經回你,k7 以後,x87 浮點運算的王者已經是 amd 了,關於這點,想必你還是不了解從何比較,ace's hardware 上有不錯的分析,看過後自然了解為什麼 k7/k8 的浮點強。

http://www.aceshardware.com/read.jsp?id=40000189
從文章的分析數據可以看出,k7 的 x87 浮點運算指令不只在 throughtput(他是指指令週期,並不是總輸出) 與 latency 上勝過 p3(p6 core)/p4(p68 core)。另外 k7 因為有三條 x87 fpu pipeline 同時可完成的浮點運算也比 p3/p4 更多。
而實測數據上,k7 的 x87 fpu 也強過 p3/p4 許多。
而最後有比到 SSE2 最佳化數據,p4 可以扳回一半的測試項目,變得互有勝負,很可惜這篇文章太早,k7 thunderbird 還未支援 SSE2,而 thoroughbred 支援 SSE2,所以勝負還未定,不過至少在 maya 上,即使有 sse 最佳化,p4 還是敗給 k7,所以有關 SSE2 請參考下列網址:

http://www.techreport.com/reviews/2...5/index.x?pg=13
這邊可以看到 TR 使用 sciencemark 的分析,很明顯大部分情況下,k8 遠優於 p4,但是極少數狀況,p4 勝過 k8,這就是為什麼有些運用或是軟體最佳化後,p4 可勝過 k8,但是大部分情形,還是 k8 大勝 p4。另外一點就是演算法其流程(分支時),大部分演算法都是資料相關,造成分支預測正確率低,使得 p4 超深管線性能更糟。少部分像是 FFT, DCT, iDCT 與矩陣運算等(matrix)比較簡單的運算是與資料無關的,p4 比較有機會勝過 k8,但一但用到更複雜演算法或組合時,就會與資料相依了,p4 優勢就沒了。
從裡面的分析數據,可發現這些運算都是對 k7/k8 有利,並且大勝 p4,而在 BLAS DGEMM 做矩陣運算上,可看到 C compile 指的是 x87,k8 比 p4 強許多,而使用 assembly 最佳化上,也是 k8 強過 p4 許多,而在 SSE scalar 上 k8 更超出 1 倍以上的性能,p4 唯一的優勢是使用 SSE packed 來最佳化。這或多或少也解釋了現今真實軟體測出的狀況吧!!!
p4 或與能因為最佳化在 benchmark 上取得高分,但一但到真實軟體上,不是只做一件簡單的演算法或運算,更不是一種最佳化(SSE2 packed) 就能解決的,在此複雜的環境下,k8 的優勢就出現了。

http://www.xbitlabs.com/articles/cp...on64-x2_14.html
除了 sciencemark 外,常見的 matlab 與 mathematica 的數據在 xbit labs, anandtech, thg 等網站上也十分容易查到,很明顯是 k7/k8 遠勝 p3/p4,我就不列舉,請自行查閱吧!!!
舊 2005-05-12, 11:31 AM #43
回應時引用此文章
jasonyang離線中