PCDVD數位科技討論區 - 瀏覽單個文章 - 請問Intel贏amd那些方面(32位元)

引用:

作者SuperAoi

就我知道intel的浮點運算勝過amd
所以適合3d製作人員
但amd在玩game似乎又勝過intel
想請問intel與amd各有那些優勢與劣勢呢？
虛心請教只是想多了解二者的差異
請各位高手幫忙解答，謝謝!!

我想前面已經很多人已經回你，k7 以後，x87 浮點運算的王者已經是 amd 了，關於這點，想必你還是不了解從何比較，ace's hardware 上有不錯的分析，看過後自然了解為什麼 k7/k8 的浮點強。

http://www.aceshardware.com/read.jsp?id=40000189
從文章的分析數據可以看出，k7 的 x87 浮點運算指令不只在 throughtput(他是指指令週期，並不是總輸出) 與 latency 上勝過 p3(p6 core)/p4(p68 core)。另外 k7 因為有三條 x87 fpu pipeline 同時可完成的浮點運算也比 p3/p4 更多。
而實測數據上，k7 的 x87 fpu 也強過 p3/p4 許多。
而最後有比到 SSE2 最佳化數據，p4 可以扳回一半的測試項目，變得互有勝負，很可惜這篇文章太早，k7 thunderbird 還未支援 SSE2，而 thoroughbred 支援 SSE2，所以勝負還未定，不過至少在 maya 上，即使有 sse 最佳化，p4 還是敗給 k7，所以有關 SSE2 請參考下列網址：

http://www.techreport.com/reviews/2...5/index.x?pg=13
這邊可以看到 TR 使用 sciencemark 的分析，很明顯大部分情況下，k8 遠優於 p4，但是極少數狀況，p4 勝過 k8，這就是為什麼有些運用或是軟體最佳化後，p4 可勝過 k8，但是大部分情形，還是 k8 大勝 p4。另外一點就是演算法其流程(分支時)，大部分演算法都是資料相關，造成分支預測正確率低，使得 p4 超深管線性能更糟。少部分像是 FFT, DCT, iDCT 與矩陣運算等(matrix)比較簡單的運算是與資料無關的，p4 比較有機會勝過 k8，但一但用到更複雜演算法或組合時，就會與資料相依了，p4 優勢就沒了。
從裡面的分析數據，可發現這些運算都是對 k7/k8 有利，並且大勝 p4，而在 BLAS DGEMM 做矩陣運算上，可看到 C compile 指的是 x87，k8 比 p4 強許多，而使用 assembly 最佳化上，也是 k8 強過 p4 許多，而在 SSE scalar 上 k8 更超出 1 倍以上的性能，p4 唯一的優勢是使用 SSE packed 來最佳化。這或多或少也解釋了現今真實軟體測出的狀況吧!!!
p4 或與能因為最佳化在 benchmark 上取得高分，但一但到真實軟體上，不是只做一件簡單的演算法或運算，更不是一種最佳化(SSE2 packed) 就能解決的，在此複雜的環境下，k8 的優勢就出現了。

http://www.xbitlabs.com/articles/cp...on64-x2_14.html
除了 sciencemark 外，常見的 matlab 與 mathematica 的數據在 xbit labs, anandtech, thg 等網站上也十分容易查到，很明顯是 k7/k8 遠勝 p3/p4，我就不列舉，請自行查閱吧!!!