PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   劍指i7:AMD推土機型號、詳細規格首曝 (https://www.pcdvd.com.tw/showthread.php?t=923308)

Jeff1987 2011-03-18 08:57 PM

引用:
作者orakim
不是從這邊(這邊的是2010的)
而是更早之前的消息(2009)
我只訂閱日文版的消息所以只有留日文連結,Google看看 應該可以很容易的找到英文版的
http://pc.watch.impress.co.jp/docs/...112_328392.html
CPU核心增加50%面積增加80%效能
增加的最主要就是整數運算單元 在加上一些共享的機制
整數運算單元部份不太可能同一模組的兩個是不對稱的
如果是這樣真的是自己找自己麻煩(架構上也看不出是不對稱的,也沒有任何消息指出他們是不對稱的)
所以很簡單的得出整數單元只有80%的效能

另外從這篇 (http://blogs.amd.com/work/2010/08/1...t=Google+Reader)也可以得出
行銷手法之厲害

想問一下
既然是兩個核心去共享快取的架構
會不會當一個核心使用時是100%效能,但當兩核心使用時因快取沒增加所以總效能只提升60%?
因為假如說是80%+80%的機制,那這樣在分享快取不變下,似乎就是當單核心跑時快取只用一半?感覺好像怪怪的
以上是小弟的疑問跟猜測啦@@
因為日文那篇看不懂XD

bpoff 2011-03-18 09:00 PM

引用:
作者hagger
所以您之前提到推土機單個執行緒效能只有 PII的80%是根據底下這句描述來的?
「一模組的throughpu約是雙核的80%」


原文是說 "一模組" 相對於完整的雙核只能提供其8成的吞吐能力, 並沒有說明當模組內只有一個單元運作時的狀況. 但是是否會降低還是要翻一下那張結構圖比較好判斷.

chlang 2011-03-18 09:01 PM

引用:
作者orakim
CPU核心增加50%面積增加80%效能
增加的最主要就是整數運算單元 在加上一些共享的機制
整數運算單元部份不太可能同一模組的兩個是不對稱的
如果是這樣真的是自己找自己麻煩(架構上也看不出是不對稱的,也沒有任何消息指出他們是不對稱的)
所以很簡單的得出整數單元只有80%的效能


突然想到一個盲點, 不知道對不對

原本單核心 面積 = 100, 性能 = 100
新的雙核心面積 = 150, 性能 = 180 (就是增加 80%)

根據小弟的除法, 180 除以 2 = 90

因此結論所謂的新單核效能不是 80%, 而是 90%. 這樣算對嗎 ?

orakim 2011-03-18 09:04 PM

引用:
作者alexgti2604
因為我的使用用途來說.像是HT那種功能對我是無用也用不太到
所以我比較關心堆土機架構1C的單線程效能到哪裡?
堆土機的1C效能約是SB的90%~95%.這樣一來以AMD的市場策略

雖然不是問我 先把東西都擺出來看
1.Bulldozer 整數運算架構上削弱了1/3(剩下2/3)
2.FPU如果是同一模組雙核心一起用則效能可能持平
(如果一模組只有一核心在用FPU Bulldozer會比K10的FPU還快一些)
3.Bulldozer這種簡單化的設計 時脈可以比K10再往上提昇一些
4.Bulldozer 的TC 2.0

總和起來Bulldozer的效能取決於時脈上
雖然看起來像是廢話一句,不過這個架構整體看是削弱的(時脈如果還不高 甚至會被自己的K10的Llano比下去)

jimmyyang207 2011-03-18 09:12 PM

引用:
作者chlang
突然想到一個盲點, 不知道對不對

原本單核心 面積 = 100, 性能 = 100
新的雙核心面積 = 150, 性能 = 180 (就是增加 80%)

根據小弟的除法, 180 除以 2 = 90

因此結論所謂的新單核效能不是 80%, 而是 90%. 這樣算對嗎 ?

以現有資訊只能大概知道一個模組的效能應該不差,
可以確定一個模組(2 Cores)全速運作時,ALU的性能應該是暴走XD
但是要以Core來計算效能,是不是直接除以二就對?
小弟認為,還要考慮摸組資源共享的部分...
所以推論一個Core帶來的整體性能應該不會是一個模組直接除以二的性能。

當然以上這些都是假設啦XD...
只希望AMD快點推出牛肉!不要讓大家太失望了 :fear:

bpoff 2011-03-18 09:16 PM

引用:
作者jimmyyang207
以現有資訊只能大概知道一個模組的效能應該不差,
可以確定一個模組(2 Cores)全速運作時,ALU的性能應該是暴走XD
但是要以Core來計算效能,是不是直接除以二就對?
小弟認為,還要考慮摸組資源共享的部分...
所以推論一個Core帶來的整體性能應該不會是一個模組直接除以二的性能。

當然以上這些都是假設啦XD...
只希望AMD快點推出牛肉!不要讓大家太失望了 :fear:


性能應該是不會太弱, 只是不知道記憶體頻寬能不能像 sandybridge 一樣有大幅進步, 還有晶片組希望也能進步一些, p67/h67 這代各家做出來的板子小毛病都不少的樣子, 讓我一直下不了手...............

jimmyyang207 2011-03-18 09:22 PM

引用:
作者bpoff
性能應該是不會太弱, 只是不知道記憶體頻寬能不能像 sandybridge 一樣有大幅進步, 還有晶片組希望也能進步一些, p67/h67 這代各家做出來的板子小毛病都不少的樣子, 讓我一直下不了手...............

我還是忍不住衝2600K了,哈...
還好運氣不錯可以超到4.5穩定用 :shy:
就算推土機出來效能大爆走也應該不會讓我到捶心肝的地步 :stupefy:

alexgti2604 2011-03-18 09:45 PM

引用:
作者orakim
雖然不是問我 先把東西都擺出來看
1.Bulldozer 整數運算架構上削弱了1/3(剩下2/3)
2.FPU如果是同一模組雙核心一起用則效能可能持平
(如果一模組只有一核心在用FPU Bulldozer會比K10的FPU還快一些)
3.Bulldozer這種簡單化的設計 時脈可以比K10再往上提昇一些
4.Bulldozer 的TC 2.0

總和起來Bulldozer的效能取決於時脈上
雖然看起來像是廢話一句,不過這個架構整體看是削弱的(時脈如果還不高 甚至會被自己的K10的Llano比下去)


從你的解說中.感覺有些了解.但也不全懂.外加有一些小失望
因為從你說的幾點:
Bulldozer這種簡單化的設計 時脈可以比K10再往上提昇一些
總和起來Bulldozer的效能取決於時脈上
不過這個架構整體看是削弱的(時脈如果還不高 甚至會被自己的K10的Llano比下去)

不知道我有沒有會錯意.以上來看1C單線程的效能是只比同時脈的PII
稍強
然後推土機的架構2M4T跟3M6T的2M/3M的模塊"大小".及"功耗"上是否分別
只稍大於X2/X3?
假設如果一樣是3.2G相比.FX4000 2M4T/FX6000 3M6T 在模塊大小/功耗
只稍大於X2 555 3.2G/X3 450 3.2G

那麼除了1C並沒有比PII強多少的話.但是從另一個角度看(理解)是不是推土機
架構在1C沒有比PII同時脈強多少之下.但是體積以及功耗上卻大大的降低
也就是說只要X2 555的體積/功耗就有相當X4 955的效能.比X3 450的體積/功耗
在略多一些就有相當X6 1090T的效能
(不知道我這樣的理解是否錯誤?)

physx 2011-03-18 09:57 PM

引用:
作者orakim
另外單核心的整數運算其實是從3條改成2條 而不是4條


關於這點經我查證之後....真得是我搞錯了 :stupefy:

推土機是一個模塊4條每個核心2條.....先詪你說聲抱歉 :jolin:

http://hi.baidu.com/tyc6982/blog/it...e81e17a281.html

然後我在解釋一下我的觀點

所謂單執行緒100%是指一個模塊只有"一顆核心運作"的情況下(另一顆閒置)才成立

因為推土機模塊是共用快取+FPU,所以一顆閒置另一顆就可以完全運用另一顆的資源

偶是這樣認為的,所謂的推土機模塊是在兩個條件下成立的

(1)單顆核心是指一個模塊內的"1C+2MB L2+256bit FPU"才是推土機真正的"1C"單執行緒性能(100%)

(2)另一顆核心是"輔助運算","2C共用2MB L2+256bit FPU",就會變成80%+80%=160%


AMD設計推土機的目的是建立在"先確定單執行緒性能"的情況下提高多執行緒性能

另外我認為推土機的單顆核心不能跟K10做對比

(1)單執行緒不會是K10的80%

(2)一個模塊也不會是K10的160%

否則四個模塊=160%*4=640% 只比現在X6多不到10%性能

AMD已經說過比X6快50%,所以用K10對比推土機是不成立的

另外後藤那篇說推土機單核類似K6,我承認我看到日文就頭痛..所以用google翻譯..

我想他指的意思是核心概念精簡退回K6時的情況,而不是指效能會從K10到退回K6

最後還是要說

如果真的要犧牲單線程,AMD完全沒有必要搞"模塊"這種東西

靠32nm做一個八核心的K10.5 時脈再拉到4G效能也能提高20%以上,而且單線程也不會降低

如果真的要犧牲單線程,也能縮小核心做一個桌面12or16核心的CPU,完全不需要大費周章搞模塊這種東西

推土機是為了讓核心發揮最大效率而製作出來的架構,絕對不是犧牲單線程來增加多線程的架構

原本7點就要發的文因為一點一外拖到10點...頭痛~"~

physx 2011-03-18 10:03 PM

引用:
作者alexgti2604
想請問一下以前面你說的
2M4T=3.5C
3M6T=5C
加上你上面提到的當一個模塊只有一個核心運作時,單線程性能100%
(運用所有快取+FPU)那堆土機的1C單線程效能會到哪呢?跟PII相比
或是SB平台相比
假設I5 2400 1C單線程效能是100分好了.那這樣同時脈3.1G時.堆土機
的1C效能估計會是多少呢?80?90?甚至是105?110呢?

因為我的使用用途來說.像是HT那種功能對我是無用也用不太到
所以我比較關心堆土機架構1C的單線程效能到哪裡?

目前我是對2M4T跟3M6T產品比較有興趣.我是比較私心的希望
堆土機的1C效能約是SB的90%~95%.這樣一來以AMD的市場策略
在CPU以及主機板晶片組售價上.應該會採取比較有競爭力的定價

不會像INTEL的主機板晶片組那樣的貴森森.希望AM3+主機板售價上
依然是很有優勢


如果SNB的單線程是100分的話,同時脈PII就只有60~65分(別懷疑就是這麼低)

推土機沒意外會是在80~90分中間,但是推土機時脈應該會比SNB高,所以有機會打平,但要贏應該有困難

但影響單執行緒最關鍵的還是解碼器這部分,AMD一直都很保密不對外公開任何資訊,只能等東西出來才知道了


所有的時間均為GMT +8。 現在的時間是07:10 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。