PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   劍指i7:AMD推土機型號、詳細規格首曝 (https://www.pcdvd.com.tw/showthread.php?t=923308)

K8FX 2011-03-17 11:33 PM

假如2M4T效能能跟4C4T的I5-760 2.8G打平~
3M6T打掉舊i7 4C8T是一定的!!

I5-2500可能還壓不過喔?!

魚骨頭 2011-03-18 12:36 AM

引用:
作者physx
前面貼過一次現在再貼一次

2C4T=2.5C
2M4T=3.5C(FX-4000)
4C8T=5C
3M6T=5C(FX-6000)
4M8T=6.5C(FX-8000)
6C12T=7.5C
8C16T=10C
6M12T=10C

正常來說FX-4000效能至少可以跟i5-760打平,耗電也會比X4更低

FX-8000贏2600K的機率可以說是100%..AMD自己也講過同樣是超執行緒他們的做法比intel更有效率

至於單執行緒,可能追不上intel,但贏現在飛龍也是100%的事...不然改架構幹嘛?

一個模塊、單核心可用2MB塊取+256bit FPU運算AVX,而且流水線也從飛龍的3條改成4條

光這樣想就知道單執行緒根本不可能倒退,時脈更高的情況下甚至有電掉intel的可能

我上面寫的比對就是依AMD自己的理論推算出來的結果

(1)一個模塊可以達到雙核80%的效能(160%)

(2)增加50%晶片面積,提高80%的效能(180%)

FX-8000會打輸2600K那代表這根本就是一個設計失敗的架構 :sleep:


那也是在一個模塊下才會贏HT

就因為整數運算多一倍 :agree:

而不是靠HT盡量塞滿ALU的閒置狀態

如果推土機加上超線程不知道會不會很變態 :hungry:

這種事在我有生之年應該不會出現

I社不會賣這種專利授權給A

jior 2011-03-18 02:39 AM

引用:
作者i2626
閣下是在下遇過第一個願意改錯字的,好感動 :cry:

我一看到你說的就知道是說錯字
這字我常打錯 :nonono:

orakim 2011-03-18 06:33 AM

引用:
作者physx
推土機模塊的原理是:
當一個模塊只有一個核心運作時,單線程性能100%(運用所有快取+FPU)
兩個核心運作時,共享快取+FPU,性能增加到160%
絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為:stupefy: )

這兩點的差異在?
整數、浮點運算上應該是平均的,整體來說單執行緒是不會跑出100%的成績

光FPU或許可能啦,但整體CPU的話有整數在拖累
以大部分的運算都是整數運算來說,單執行緒不可能100%

引用:
“How much extra performance will we see when running two-threaded applications on one Bulldozer Module compared to two cores in different modules?” – Simon

Without getting too specific around actual scaling across cores on the processor, let me share with you what was in the Hot Chips presentation. Compared to CMP (chip multiprocessing – which is, in simplistic terms building a multicore chip with each core having its own dedicated resources) two integer cores in a Bulldozer module would deliver roughly 80% of the throughput. But, because they have shared resources, they deliver that throughput at low power and low cost.

http://blogs.amd.com/work/2010/08/3...t=Google+Reader
問題:Bulldozer模組化會不會增加性能
回答:共享只是單純減少省電省錢手段,一模組的throughpu約是雙核的80%

這種回答應該已經很明顯了

引用:
一個模塊、單核心可用2MB塊取+256bit FPU運算AVX,而且流水線也從飛龍的3條改成4條

光這樣想就知道單執行緒根本不可能倒退,時脈更高的情況下甚至有電掉intel的可能

另外單核心的整數運算其實是從3條改成2條 而不是4條
這部份你誤解了(除非你是指一模組共4條,不過看你寫的後面部份似乎不是這樣)
整数演算パフォーマンスを犠牲にして効率を取るAMDの「Bulldozer」
http://pc.watch.impress.co.jp/docs/...205_346902.html
都已經拿K6-3說他比較接近Bulldozer

hagger 2011-03-18 10:40 AM

引用:
作者orakim
這兩點的差異在?
整數、浮點運算上應該是平均的,整體來說單執行緒是不會跑出100%的成績

光FPU或許可能啦,但整體CPU的話有整數在拖累
以大部分的運算都是整數運算來說,單執行緒不可能100%


http://blogs.amd.com/work/2010/08/3...t=Google+Reader
問題:Bulldozer模組化會不會增加性能
回答:共享只是單純減少省電省錢手段,一模組的throughpu約是雙核的80%

這種回答應該已經很明顯了


另外單核心的整數運算其實是從3條改成2條 而不是4條
這部份你誤解了(除非你是指一模組共4條,不過看你寫的後面部份似乎不是這樣)
整数演算パフォーマンスを犠牲に...

所以您之前提到推土機單個執行緒效能只有 PII的80%是根據底下這句描述來的?
「一模組的throughpu約是雙核的80%」

unrealt535i 2011-03-18 11:23 AM

引用:
作者physx

絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為:stupefy: )

如果AMD放棄單線程,就乾脆把核心縮小到50%然後塞16顆不就好了,模塊化幹嘛 :jolin:



對不起,我也是這樣認為所以差點想棄A投I了..... :stupefy:

我要收回我之前說AMD根本就沒沒進步的話 :think:

unrealt535i 2011-03-18 11:40 AM

引用:
作者阿正

如果考慮到LLANO的CPU核心只是製程進化、砍L3的PII
AMD給這個老核心多配點GPU效能出來一點都不過分XD



沒錯,AMD在L2或是L3快取的效能真的沒有做的很OK過(明明還內建了記憶體控制器說.....),還記得以前K8剛出來為90nm製程的時候那時L2配的是1M,效能普遍都還不錯,後來改65nm時為了降低成本把1MB降成512K,在加上製程轉換過程不是很順利造成65nm的U同等級效能居然輸給上代的90nm的U,到了現在K10.5狀況也是,如果不是因為遊戲軟體會吃L3快取,不然P II的那L3根本就是有跟沒有一樣.....

所以我也贊成而且看好AMD對LLANO砍L3加大L2的作法 :like:

總覺得前任CEO被請走後,AMD在U或是GPU設計走的路線有回歸正軌的感覺 :D

K8FX 2011-03-18 07:13 PM

山地橋在支援avx的win7sp1下
FPU成績大增~!!!
http://www.mobile01.com/topicdetail...0&last=26595251

記得AMD不是打算弱化FPU,搞融合用GPU來分擔以往的FPU嗎?

在K6-2時代,AMD的FPU一直被打假的~
當時顯卡沒那麼發達,玩遊戲FPU很重要

不曉得融合地FPU搞的如何了?!

alexgti2604 2011-03-18 08:19 PM

引用:
作者physx
順便在說一下,偶認為SNB跟推土機和前代的CPU相比之下都有絕對的優勢,那就是AVX指令集

藉由這個指令集來運算浮點效能有翻倍的可能

還有就是AMD是認為單執行緒上的進步上非常緩慢,多核心又會增加大量功耗,所以才開發推土機架構

目的是在單核心提升的同時更有效率的增加多線程性能,而不是認為單執行緒不重要所以犧牲單線程來提高多線程

推土機模塊的原理是:

當一個模塊只有一個核心運作時,單線程性能100%(運用所有快取+FPU)

兩個核心運作時,共享快取+FPU,性能增加到160%

絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為:stupefy: )

如果AMD放棄單線程,就乾脆把核心縮小到50%然後塞16顆不就好了,模塊化幹嘛 :jolin:


想請問一下以前面你說的
2M4T=3.5C
3M6T=5C
加上你上面提到的當一個模塊只有一個核心運作時,單線程性能100%
(運用所有快取+FPU)那堆土機的1C單線程效能會到哪呢?跟PII相比
或是SB平台相比
假設I5 2400 1C單線程效能是100分好了.那這樣同時脈3.1G時.堆土機
的1C效能估計會是多少呢?80?90?甚至是105?110呢?

因為我的使用用途來說.像是HT那種功能對我是無用也用不太到
所以我比較關心堆土機架構1C的單線程效能到哪裡?

目前我是對2M4T跟3M6T產品比較有興趣.我是比較私心的希望
堆土機的1C效能約是SB的90%~95%.這樣一來以AMD的市場策略
在CPU以及主機板晶片組售價上.應該會採取比較有競爭力的定價

不會像INTEL的主機板晶片組那樣的貴森森.希望AM3+主機板售價上
依然是很有優勢

orakim 2011-03-18 08:33 PM

引用:
作者hagger
所以您之前提到推土機單個執行緒效能只有 PII的80%是根據底下這句描述來的?
「一模組的throughpu約是雙核的80%」

不是從這邊(這邊的是2010的)
而是更早之前的消息(2009)
我只訂閱日文版的消息所以只有留日文連結,Google看看 應該可以很容易的找到英文版的
http://pc.watch.impress.co.jp/docs/...112_328392.html
CPU核心增加50%面積增加80%效能
增加的最主要就是整數運算單元 在加上一些共享的機制
整數運算單元部份不太可能同一模組的兩個是不對稱的
如果是這樣真的是自己找自己麻煩(架構上也看不出是不對稱的,也沒有任何消息指出他們是不對稱的)
所以很簡單的得出整數單元只有80%的效能

另外從這篇也可以得出
行銷手法之厲害


所有的時間均為GMT +8。 現在的時間是07:11 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。