引用:
作者physx
推土機模塊的原理是:
當一個模塊只有一個核心運作時,單線程性能100%(運用所有快取+FPU)
兩個核心運作時,共享快取+FPU,性能增加到160%
絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為  )
|
這兩點的差異在?
整數、浮點運算上應該是平均的,整體來說單執行緒是不會跑出100%的成績
光FPU或許可能啦,但整體CPU的話有整數在拖累
以大部分的運算都是整數運算來說,單執行緒不可能100%
引用:
“How much extra performance will we see when running two-threaded applications on one Bulldozer Module compared to two cores in different modules?” – Simon
Without getting too specific around actual scaling across cores on the processor, let me share with you what was in the Hot Chips presentation. Compared to CMP (chip multiprocessing – which is, in simplistic terms building a multicore chip with each core having its own dedicated resources) two integer cores in a Bulldozer module would deliver roughly 80% of the throughput. But, because they have shared resources, they deliver that throughput at low power and low cost.
|
http://blogs.amd.com/work/2010/08/3...t=Google+Reader
問題:Bulldozer模組化會不會增加性能
回答:共享只是單純減少省電省錢手段,一模組的throughpu約是雙核的80%
這種回答應該已經很明顯了
引用:
一個模塊、單核心可用2MB塊取+256bit FPU運算AVX,而且流水線也從飛龍的3條改成4條
光這樣想就知道單執行緒根本不可能倒退,時脈更高的情況下甚至有電掉intel的可能
|
另外單核心的整數運算其實是從3條改成2條 而不是4條
這部份你誤解了(除非你是指一模組共4條,不過看你寫的後面部份似乎不是這樣)
整数演算パフォーマンスを犠牲にして効率を取るAMDの「Bulldozer」
http://pc.watch.impress.co.jp/docs/...205_346902.html
都已經拿K6-3說他比較接近Bulldozer