引用:
作者Reich 唐
說實話,AMD的L2 cache嚴格來說效能並不好,所以1MB的K8比起512KB的K8,效能增加也不那麼明顯。
而Intel的L2 cache就比較精良,所以同樣是northwood核心,128K的Celeron與512K的P4效能天差地遠。
AMD的L2 cache最主要的關鍵是卡在對外頻寬不夠,K7架構僅64bit,K8也只有128bit,反觀Intel從Coppermine核心P3開始,就是256bit,因此AMD雖然不斷改良L2的架構(16路檢索路線、快速TLB機制等),但頻寬不夠大,資料傳不出去也沒用。
這裡僅僅是討論L2喔,L1從K6開始,多年來都是AMD比較強,Intel只有Pentium M有比較像樣的L1。
|
L2頻寬問題不代表L2"精不精良"
K7/K8用的是exclisive cache,此架構L1與L2資料是分開存放的,L2只要有就能增進效能,比例的多寡不需要像inclusive那樣要求.
p3/p4用的是inclusive cache,此架構L1存放的資料再L2也有一份,L1與L2的容量比值需有一定比例效能才會比較好