PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 系統組件
帳戶
密碼
 

  回應
 
主題工具
K8FX
Advance Member
 
K8FX的大頭照
 

加入日期: Feb 2005
文章: 342
假如2M4T效能能跟4C4T的I5-760 2.8G打平~
3M6T打掉舊i7 4C8T是一定的!!

I5-2500可能還壓不過喔?!
     
      
舊 2011-03-17, 11:33 PM #81
回應時引用此文章
K8FX離線中  
魚骨頭
Junior Member
 
魚骨頭的大頭照
 

加入日期: Jun 2010
文章: 803
引用:
作者physx
前面貼過一次現在再貼一次

2C4T=2.5C
2M4T=3.5C(FX-4000)
4C8T=5C
3M6T=5C(FX-6000)
4M8T=6.5C(FX-8000)
6C12T=7.5C
8C16T=10C
6M12T=10C

正常來說FX-4000效能至少可以跟i5-760打平,耗電也會比X4更低

FX-8000贏2600K的機率可以說是100%..AMD自己也講過同樣是超執行緒他們的做法比intel更有效率

至於單執行緒,可能追不上intel,但贏現在飛龍也是100%的事...不然改架構幹嘛?

一個模塊、單核心可用2MB塊取+256bit FPU運算AVX,而且流水線也從飛龍的3條改成4條

光這樣想就知道單執行緒根本不可能倒退,時脈更高的情況下甚至有電掉intel的可能

我上面寫的比對就是依AMD自己的理論推算出來的結果

(1)一個模塊可以達到雙核80%的效能(160%)

(2)增加50%晶片面積,提高80%的效能(180%)

FX-8000會打輸2600K那代表這根本就是一個設計失敗的架構


那也是在一個模塊下才會贏HT

就因為整數運算多一倍

而不是靠HT盡量塞滿ALU的閒置狀態

如果推土機加上超線程不知道會不會很變態

這種事在我有生之年應該不會出現

I社不會賣這種專利授權給A
 
__________________
良興卡號:13214833

此文章於 2011-03-18 12:37 AM 被 魚骨頭 編輯.
舊 2011-03-18, 12:36 AM #82
回應時引用此文章
魚骨頭離線中  
jior
Power Member
 
jior的大頭照
 

加入日期: May 2004
文章: 609
引用:
作者i2626
閣下是在下遇過第一個願意改錯字的,好感動

我一看到你說的就知道是說錯字
這字我常打錯
__________________
rev.VII
AMD Ryzen 9 3900x|ASUS Strix X570-i|Micron Ballistix Sport LT DDR4-3733 16Gx2 |GIGABYTE GTX1080 TURBO OC
03 USD|NuForce DAC-9 192K|Plinius 9100|ELAC BS312|LG 49UM7300
Abee RS01|be quite! Dark Rock TF| Corsair SF-600
DasKeyBoard

此文章於 2011-03-18 02:41 AM 被 jior 編輯.
舊 2011-03-18, 02:39 AM #83
回應時引用此文章
jior離線中  
orakim
Master Member
 

加入日期: Sep 2003
文章: 1,810
引用:
作者physx
推土機模塊的原理是:
當一個模塊只有一個核心運作時,單線程性能100%(運用所有快取+FPU)
兩個核心運作時,共享快取+FPU,性能增加到160%
絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為 )

這兩點的差異在?
整數、浮點運算上應該是平均的,整體來說單執行緒是不會跑出100%的成績

光FPU或許可能啦,但整體CPU的話有整數在拖累
以大部分的運算都是整數運算來說,單執行緒不可能100%

引用:
“How much extra performance will we see when running two-threaded applications on one Bulldozer Module compared to two cores in different modules?” – Simon

Without getting too specific around actual scaling across cores on the processor, let me share with you what was in the Hot Chips presentation. Compared to CMP (chip multiprocessing – which is, in simplistic terms building a multicore chip with each core having its own dedicated resources) two integer cores in a Bulldozer module would deliver roughly 80% of the throughput. But, because they have shared resources, they deliver that throughput at low power and low cost.

http://blogs.amd.com/work/2010/08/3...t=Google+Reader
問題:Bulldozer模組化會不會增加性能
回答:共享只是單純減少省電省錢手段,一模組的throughpu約是雙核的80%

這種回答應該已經很明顯了

引用:
一個模塊、單核心可用2MB塊取+256bit FPU運算AVX,而且流水線也從飛龍的3條改成4條

光這樣想就知道單執行緒根本不可能倒退,時脈更高的情況下甚至有電掉intel的可能

另外單核心的整數運算其實是從3條改成2條 而不是4條
這部份你誤解了(除非你是指一模組共4條,不過看你寫的後面部份似乎不是這樣)
整数演算パフォーマンスを犠牲にして効率を取るAMDの「Bulldozer」
http://pc.watch.impress.co.jp/docs/...205_346902.html
都已經拿K6-3說他比較接近Bulldozer

此文章於 2011-03-18 06:41 AM 被 orakim 編輯.
舊 2011-03-18, 06:33 AM #84
回應時引用此文章
orakim離線中  
hagger
Junior Member
 
hagger的大頭照
 

加入日期: Feb 2004
您的住址: 南投
文章: 983
引用:
作者orakim
這兩點的差異在?
整數、浮點運算上應該是平均的,整體來說單執行緒是不會跑出100%的成績

光FPU或許可能啦,但整體CPU的話有整數在拖累
以大部分的運算都是整數運算來說,單執行緒不可能100%


http://blogs.amd.com/work/2010/08/3...t=Google+Reader
問題:Bulldozer模組化會不會增加性能
回答:共享只是單純減少省電省錢手段,一模組的throughpu約是雙核的80%

這種回答應該已經很明顯了


另外單核心的整數運算其實是從3條改成2條 而不是4條
這部份你誤解了(除非你是指一模組共4條,不過看你寫的後面部份似乎不是這樣)
整数演算パフォーマンスを犠牲に...

所以您之前提到推土機單個執行緒效能只有 PII的80%是根據底下這句描述來的?
「一模組的throughpu約是雙核的80%」
舊 2011-03-18, 10:40 AM #85
回應時引用此文章
hagger離線中  
unrealt535i
Major Member
 

加入日期: Jul 2004
文章: 267
引用:
作者physx

絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為 )

如果AMD放棄單線程,就乾脆把核心縮小到50%然後塞16顆不就好了,模塊化幹嘛



對不起,我也是這樣認為所以差點想棄A投I了.....

我要收回我之前說AMD根本就沒沒進步的話
舊 2011-03-18, 11:23 AM #86
回應時引用此文章
unrealt535i離線中  
unrealt535i
Major Member
 

加入日期: Jul 2004
文章: 267
引用:
作者阿正

如果考慮到LLANO的CPU核心只是製程進化、砍L3的PII
AMD給這個老核心多配點GPU效能出來一點都不過分XD



沒錯,AMD在L2或是L3快取的效能真的沒有做的很OK過(明明還內建了記憶體控制器說.....),還記得以前K8剛出來為90nm製程的時候那時L2配的是1M,效能普遍都還不錯,後來改65nm時為了降低成本把1MB降成512K,在加上製程轉換過程不是很順利造成65nm的U同等級效能居然輸給上代的90nm的U,到了現在K10.5狀況也是,如果不是因為遊戲軟體會吃L3快取,不然P II的那L3根本就是有跟沒有一樣.....

所以我也贊成而且看好AMD對LLANO砍L3加大L2的作法

總覺得前任CEO被請走後,AMD在U或是GPU設計走的路線有回歸正軌的感覺
舊 2011-03-18, 11:40 AM #87
回應時引用此文章
unrealt535i離線中  
K8FX
Advance Member
 
K8FX的大頭照
 

加入日期: Feb 2005
文章: 342
山地橋在支援avx的win7sp1下
FPU成績大增~!!!
http://www.mobile01.com/topicdetail...0&last=26595251

記得AMD不是打算弱化FPU,搞融合用GPU來分擔以往的FPU嗎?

在K6-2時代,AMD的FPU一直被打假的~
當時顯卡沒那麼發達,玩遊戲FPU很重要

不曉得融合地FPU搞的如何了?!
舊 2011-03-18, 07:13 PM #88
回應時引用此文章
K8FX離線中  
alexgti2604
Regular Member
 

加入日期: Mar 2011
文章: 73
引用:
作者physx
順便在說一下,偶認為SNB跟推土機和前代的CPU相比之下都有絕對的優勢,那就是AVX指令集

藉由這個指令集來運算浮點效能有翻倍的可能

還有就是AMD是認為單執行緒上的進步上非常緩慢,多核心又會增加大量功耗,所以才開發推土機架構

目的是在單核心提升的同時更有效率的增加多線程性能,而不是認為單執行緒不重要所以犧牲單線程來提高多線程

推土機模塊的原理是:

當一個模塊只有一個核心運作時,單線程性能100%(運用所有快取+FPU)

兩個核心運作時,共享快取+FPU,性能增加到160%

絕對不是很多人想的,是把單顆核心縮小性能降到80%然後塞兩顆 ( 雖然我以前也是這樣認為 )

如果AMD放棄單線程,就乾脆把核心縮小到50%然後塞16顆不就好了,模塊化幹嘛


想請問一下以前面你說的
2M4T=3.5C
3M6T=5C
加上你上面提到的當一個模塊只有一個核心運作時,單線程性能100%
(運用所有快取+FPU)那堆土機的1C單線程效能會到哪呢?跟PII相比
或是SB平台相比
假設I5 2400 1C單線程效能是100分好了.那這樣同時脈3.1G時.堆土機
的1C效能估計會是多少呢?80?90?甚至是105?110呢?

因為我的使用用途來說.像是HT那種功能對我是無用也用不太到
所以我比較關心堆土機架構1C的單線程效能到哪裡?

目前我是對2M4T跟3M6T產品比較有興趣.我是比較私心的希望
堆土機的1C效能約是SB的90%~95%.這樣一來以AMD的市場策略
在CPU以及主機板晶片組售價上.應該會採取比較有競爭力的定價

不會像INTEL的主機板晶片組那樣的貴森森.希望AM3+主機板售價上
依然是很有優勢

此文章於 2011-03-18 08:27 PM 被 alexgti2604 編輯.
舊 2011-03-18, 08:19 PM #89
回應時引用此文章
alexgti2604離線中  
orakim
Master Member
 

加入日期: Sep 2003
文章: 1,810
引用:
作者hagger
所以您之前提到推土機單個執行緒效能只有 PII的80%是根據底下這句描述來的?
「一模組的throughpu約是雙核的80%」

不是從這邊(這邊的是2010的)
而是更早之前的消息(2009)
我只訂閱日文版的消息所以只有留日文連結,Google看看 應該可以很容易的找到英文版的
http://pc.watch.impress.co.jp/docs/...112_328392.html
CPU核心增加50%面積增加80%效能
增加的最主要就是整數運算單元 在加上一些共享的機制
整數運算單元部份不太可能同一模組的兩個是不對稱的
如果是這樣真的是自己找自己麻煩(架構上也看不出是不對稱的,也沒有任何消息指出他們是不對稱的)
所以很簡單的得出整數單元只有80%的效能

另外從這篇也可以得出
行銷手法之厲害

此文章於 2011-03-18 08:41 PM 被 orakim 編輯.
舊 2011-03-18, 08:33 PM #90
回應時引用此文章
orakim離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是04:08 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。