快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會,2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大,那會造成資料若是不同於記憶體裡面,假設較舊的時後,變成整個那一段都要提取進來,造成時間的浪費,只要用到其中一個卻提取一堆,相反的way數越多,做的其實不必那麼大,快取目的在於減少不必要的等待,在記憶體潛伏裡面去做快取的動作,需要的是快速也就是大量的頻寬跟資料的正確性,還有是否為最新的資料,大不見的就是好,若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。
我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越大要去檢查資料正確性捏?這個檢查的時間不見得比較快吧?16.5裡面也這樣說捏?那我接收的知識該沒問題吧!
還有若論效能,P4不見得會輸給K8歐,重點是在於熱量根價錢,我不認為K8有幹掉P4,再這些裡面,cool &Quiet這類根本就是之前的技術,還有Hyper Transprot也是基於MCT內建之後才跑出來的,這跟原本MCT還不是歸於南北橋下?這不算創新吧?X86-64這個目前還是未定數,要等普及了再說,其實這也沒什麼,就增加Bit數目,也不算多厲害,至於修改Decoder跟TLB我倒不是很了解,可以請你說明一下嗎?
還有Sisoftsandra至少可以證明一件事情,以同時脈同外頻來說K7跟K8跑出來的值差不多,這表示什麼?你覺得咧,Sisoftsandra在我看來比較兩家產品是參考,比較自家產品才是我用這個benchmark的重點。之後的沒比較好,唯一解釋就是根本換湯不換藥。