PCDVD數位科技討論區 - 瀏覽單個文章

引用:

作者jasonyang

http://www.chip-architect.com/
http://arstechnica.com/articles/pae...-hammer-1.ars/1
http://www.cpuid.com/reviews/K8/index.php
k8 如果只是 k7 的 pipeline 加上兩個 stage，再加上記憶體控制器那麼簡單的話，效能就不會輕易的幹掉 p4 了。
k8 的改進，主要還是在提升 IPC 與增加容錯能力為目標，像是修改分支預測的方法、修改 decoder、整合記憶體控制器減少 latency、加大 TLB、x86-64、hypertransport 的 peer-to-peer communication。

http://arstechnica.com/cpu/3q99/athlon/athlon-1.html
更重要的是 k7 也跟 pentium-iii (p6 架構)根本不同，怎麼會有承襲 p3 (p6架構)的謬論???

SANDRA、PCMark、SysMark 的分數公正性有問題，過度偏袒 p4 架構，數據矛盾(新舊版本成績相反、k7 上了 media player patch 後分數暴增反敗為勝，過度注重多媒體性能、同頻率 celeron 與 p4 幾...

快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會，2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大，那會造成資料若是不同於記憶體裡面，假設較舊的時後，變成整個那一段都要提取進來，造成時間的浪費，只要用到其中一個卻提取一堆，相反的way數越多，做的其實不必那麼大，快取目的在於減少不必要的等待，在記憶體潛伏裡面去做快取的動作，需要的是快速也就是大量的頻寬跟資料的正確性，還有是否為最新的資料，大不見的就是好，若是L1越大就會提升效能那我相信要做大絕對不是難事，甚至可以挪用L2這部份來增加L1容量，太大會增加miss penalty並且造成低利用率。

我在看你貼的資料裡面找到：Also, larger caches are slower (bigger search space). 位於section 16.5第2段，接下來第3段可說是印證我的論點，大不見得比較好，他只告訴你小會比較慢，沒告訴你大會比較快。L1越大要去檢查資料正確性捏?這個檢查的時間不見得比較快吧?16.5裡面也這樣說捏?那我接收的知識該沒問題吧!

還有若論效能，P4不見得會輸給K8歐，重點是在於熱量根價錢，我不認為K8有幹掉P4，再這些裡面，cool &Quiet這類根本就是之前的技術，還有Hyper Transprot也是基於MCT內建之後才跑出來的，這跟原本MCT還不是歸於南北橋下?這不算創新吧?X86-64這個目前還是未定數，要等普及了再說，其實這也沒什麼，就增加Bit數目，也不算多厲害，至於修改Decoder跟TLB我倒不是很了解，可以請你說明一下嗎?

還有Sisoftsandra至少可以證明一件事情，以同時脈同外頻來說K7跟K8跑出來的值差不多，這表示什麼?你覺得咧，Sisoftsandra在我看來比較兩家產品是參考，比較自家產品才是我用這個benchmark的重點。之後的沒比較好，唯一解釋就是根本換湯不換藥。