瀏覽單個文章
ianme
*停權中*
 
ianme的大頭照
 

加入日期: Oct 2004
您的住址: 台北
文章: 3,188
引用:
作者jasonyang
http://www.chip-architect.com/
http://arstechnica.com/articles/pae...-hammer-1.ars/1
http://www.cpuid.com/reviews/K8/index.php
k8 如果只是 k7 的 pipeline 加上兩個 stage,再加上記憶體控制器那麼簡單的話,效能就不會輕易的幹掉 p4 了。
k8 的改進,主要還是在提升 IPC 與增加容錯能力為目標,像是修改分支預測的方法、修改 decoder、整合記憶體控制器減少 latency、加大 TLB、x86-64、hypertransport 的 peer-to-peer communication。

http://arstechnica.com/cpu/3q99/athlon/athlon-1.html
更重要的是 k7 也跟 pentium-iii (p6 架構)根本不同,怎麼會有承襲 p3 (p6架構)的謬論???

SANDRA、PCMark、SysMark 的分數公正性有問題,過度偏袒 p4 架構,數據矛盾(新舊版本成績相反、k7 上了 media player patch 後分數暴增反敗為勝,過度注重多媒體性能、同頻率 celeron 與 p4 幾...


快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會,2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大,那會造成資料若是不同於記憶體裡面,假設較舊的時後,變成整個那一段都要提取進來,造成時間的浪費,只要用到其中一個卻提取一堆,相反的way數越多,做的其實不必那麼大,快取目的在於減少不必要的等待,在記憶體潛伏裡面去做快取的動作,需要的是快速也就是大量的頻寬跟資料的正確性,還有是否為最新的資料,大不見的就是好,若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。

我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越大要去檢查資料正確性捏?這個檢查的時間不見得比較快吧?16.5裡面也這樣說捏?那我接收的知識該沒問題吧!

還有若論效能,P4不見得會輸給K8歐,重點是在於熱量根價錢,我不認為K8有幹掉P4,再這些裡面,cool &Quiet這類根本就是之前的技術,還有Hyper Transprot也是基於MCT內建之後才跑出來的,這跟原本MCT還不是歸於南北橋下?這不算創新吧?X86-64這個目前還是未定數,要等普及了再說,其實這也沒什麼,就增加Bit數目,也不算多厲害,至於修改Decoder跟TLB我倒不是很了解,可以請你說明一下嗎?

還有Sisoftsandra至少可以證明一件事情,以同時脈同外頻來說K7跟K8跑出來的值差不多,這表示什麼?你覺得咧,Sisoftsandra在我看來比較兩家產品是參考,比較自家產品才是我用這個benchmark的重點。之後的沒比較好,唯一解釋就是根本換湯不換藥。
舊 2005-11-23, 01:03 AM #67
回應時引用此文章
ianme離線中