![]() |
||
Junior Member
![]() ![]() ![]() 加入日期: Nov 2006 您的住址: earth
文章: 987
|
引用:
想問一下 既然是兩個核心去共享快取的架構 會不會當一個核心使用時是100%效能,但當兩核心使用時因快取沒增加所以總效能只提升60%? 因為假如說是80%+80%的機制,那這樣在分享快取不變下,似乎就是當單核心跑時快取只用一半?感覺好像怪怪的 以上是小弟的疑問跟猜測啦@@ 因為日文那篇看不懂XD |
||||||||
![]() |
![]() |
Junior Member
![]() ![]() ![]() 加入日期: Dec 2008
文章: 791
|
引用:
原文是說 "一模組" 相對於完整的雙核只能提供其8成的吞吐能力, 並沒有說明當模組內只有一個單元運作時的狀況. 但是是否會降低還是要翻一下那張結構圖比較好判斷. |
|||
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Dec 2001
文章: 1,747
|
引用:
突然想到一個盲點, 不知道對不對 原本單核心 面積 = 100, 性能 = 100 新的雙核心面積 = 150, 性能 = 180 (就是增加 80%) 根據小弟的除法, 180 除以 2 = 90 因此結論所謂的新單核效能不是 80%, 而是 90%. 這樣算對嗎 ? |
|
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Sep 2003
文章: 1,810
|
引用:
雖然不是問我 先把東西都擺出來看 1.Bulldozer 整數運算架構上削弱了1/3(剩下2/3) 2.FPU如果是同一模組雙核心一起用則效能可能持平 (如果一模組只有一核心在用FPU Bulldozer會比K10的FPU還快一些) 3.Bulldozer這種簡單化的設計 時脈可以比K10再往上提昇一些 4.Bulldozer 的TC 2.0 總和起來Bulldozer的效能取決於時脈上 雖然看起來像是廢話一句,不過這個架構整體看是削弱的(時脈如果還不高 甚至會被自己的K10的Llano比下去) |
|
![]() |
![]() |
Major Member
![]() 加入日期: Sep 2006
文章: 238
|
引用:
以現有資訊只能大概知道一個模組的效能應該不差, 可以確定一個模組(2 Cores)全速運作時,ALU的性能應該是暴走XD 但是要以Core來計算效能,是不是直接除以二就對? 小弟認為,還要考慮摸組資源共享的部分... 所以推論一個Core帶來的整體性能應該不會是一個模組直接除以二的性能。 當然以上這些都是假設啦XD... 只希望AMD快點推出牛肉!不要讓大家太失望了 ![]() |
|
![]() |
![]() |
Junior Member
![]() ![]() ![]() 加入日期: Dec 2008
文章: 791
|
引用:
性能應該是不會太弱, 只是不知道記憶體頻寬能不能像 sandybridge 一樣有大幅進步, 還有晶片組希望也能進步一些, p67/h67 這代各家做出來的板子小毛病都不少的樣子, 讓我一直下不了手............... |
|
![]() |
![]() |
Major Member
![]() 加入日期: Sep 2006
文章: 238
|
引用:
我還是忍不住衝2600K了,哈... 還好運氣不錯可以超到4.5穩定用 ![]() 就算推土機出來效能大爆走也應該不會讓我到捶心肝的地步 ![]() |
|
![]() |
![]() |
Regular Member
![]() ![]() 加入日期: Mar 2011
文章: 73
|
引用:
從你的解說中.感覺有些了解.但也不全懂.外加有一些小失望 因為從你說的幾點: Bulldozer這種簡單化的設計 時脈可以比K10再往上提昇一些 總和起來Bulldozer的效能取決於時脈上 不過這個架構整體看是削弱的(時脈如果還不高 甚至會被自己的K10的Llano比下去) 不知道我有沒有會錯意.以上來看1C單線程的效能是只比同時脈的PII 稍強 然後推土機的架構2M4T跟3M6T的2M/3M的模塊"大小".及"功耗"上是否分別 只稍大於X2/X3? 假設如果一樣是3.2G相比.FX4000 2M4T/FX6000 3M6T 在模塊大小/功耗 只稍大於X2 555 3.2G/X3 450 3.2G 那麼除了1C並沒有比PII強多少的話.但是從另一個角度看(理解)是不是推土機 架構在1C沒有比PII同時脈強多少之下.但是體積以及功耗上卻大大的降低 也就是說只要X2 555的體積/功耗就有相當X4 955的效能.比X3 450的體積/功耗 在略多一些就有相當X6 1090T的效能 (不知道我這樣的理解是否錯誤?) |
|
![]() |
![]() |
Senior Member
![]() ![]() ![]() 加入日期: Apr 2010
文章: 1,048
|
引用:
關於這點經我查證之後....真得是我搞錯了 ![]() 推土機是一個模塊4條每個核心2條.....先詪你說聲抱歉 ![]() http://hi.baidu.com/tyc6982/blog/it...e81e17a281.html 然後我在解釋一下我的觀點 所謂單執行緒100%是指一個模塊只有"一顆核心運作"的情況下(另一顆閒置)才成立 因為推土機模塊是共用快取+FPU,所以一顆閒置另一顆就可以完全運用另一顆的資源 偶是這樣認為的,所謂的推土機模塊是在兩個條件下成立的 (1)單顆核心是指一個模塊內的"1C+2MB L2+256bit FPU"才是推土機真正的"1C"單執行緒性能(100%) (2)另一顆核心是"輔助運算","2C共用2MB L2+256bit FPU",就會變成80%+80%=160% AMD設計推土機的目的是建立在"先確定單執行緒性能"的情況下提高多執行緒性能 另外我認為推土機的單顆核心不能跟K10做對比 (1)單執行緒不會是K10的80% (2)一個模塊也不會是K10的160% 否則四個模塊=160%*4=640% 只比現在X6多不到10%性能 AMD已經說過比X6快50%,所以用K10對比推土機是不成立的 另外後藤那篇說推土機單核類似K6,我承認我看到日文就頭痛..所以用google翻譯.. 我想他指的意思是核心概念精簡退回K6時的情況,而不是指效能會從K10到退回K6 最後還是要說 如果真的要犧牲單線程,AMD完全沒有必要搞"模塊"這種東西 靠32nm做一個八核心的K10.5 時脈再拉到4G效能也能提高20%以上,而且單線程也不會降低 如果真的要犧牲單線程,也能縮小核心做一個桌面12or16核心的CPU,完全不需要大費周章搞模塊這種東西 推土機是為了讓核心發揮最大效率而製作出來的架構,絕對不是犧牲單線程來增加多線程的架構 原本7點就要發的文因為一點一外拖到10點...頭痛~"~ |
|
![]() |
![]() |
Senior Member
![]() ![]() ![]() 加入日期: Apr 2010
文章: 1,048
|
引用:
如果SNB的單線程是100分的話,同時脈PII就只有60~65分(別懷疑就是這麼低) 推土機沒意外會是在80~90分中間,但是推土機時脈應該會比SNB高,所以有機會打平,但要贏應該有困難 但影響單執行緒最關鍵的還是解碼器這部分,AMD一直都很保密不對外公開任何資訊,只能等東西出來才知道了 |
|
![]() |
![]() |