http://techreport.com/review/28228/...servers-in-2016
重點沒有敘述清楚 老實說有貼跟沒貼大概只差在那"40%"、"SMT"
不過就這"40%" 大致上跟我猜想了有一些接近
最後一二版推土機(excavator、steamroller) 4個pipe line下 應該可以說效能略為超過K10一點點
這一點點應該可以直接忽略,把它當作K10來看就好
改善的原因是1模組有了兩個decode 分別對應四個pipe line 帶來的效應
但Zen回歸一核一個decode 卻有六個pipe line在搶
這decode感覺接近於初代bulldozer(80%K10),1個decode 有八個pipe line再搶的情形
導致初代最後單核心執行效率是每核80% K10
初代bulldozer 1個decode 最大負荷量是供應8個pipe line 產生160%K10的效能
相當於decode壓力摳米到極限下 一個pipe line最多只能貢獻20%K10效能出來
對照下 Zen有6個pipe line(比起初代bulldozer 8個pipe line 有些改善)
Zen 每個pipe line 效能應該會比初代bulldozer 再多一些 但不會高於bobcat
加上靠SMT去執行多出來的2個pipe line+其他(4個)有空閒下來的pipe line
那可能會多出40% 以上的效能(SMT雙執行緒下)
或者單純的用4個 pipe line 相當於1個K10
剩下兩個pipe line 是SMT才能啟用 效能相當於初代bulldozer的情形
那就會得出一核雙執行緒 有140% K10的效能 (我估多的效能40%是這樣來的 很無腦的猜想)
但SMT對單執行緒來說 大部分情形沒有太大關係(有少數例外會拖慢單執行緒的效能)
單執行緒還是要看新快取 能改善到什麼程度 ,不要有太大期待就是了