PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   一個笨笨的想法(對k8) (https://www.pcdvd.com.tw/showthread.php?t=560519)

ianme 2005-11-23 03:02 AM

測這兩個值跟CPU快慢沒有絕對關係,但是很明顯,在於這兩項裡面,K8跟K7的狀況是一樣地,我並沒有說K8跟K7速度一樣,要搞清楚,MIPs的能力不完全正比於CPU能力,這個我之前就有這樣說過(不是這一篇),但是你不可否認這兩項是衡量CPU的指標,就好比時脈不等於效能,但時脈就不是效能的衡量指標嗎?K8在快的部份是快在哪裡,如果都認不清,我也不知道該說什麼..

還有我重點不是跟你談Benchmark,尤其不是Sisoftsandra這個東西,從頭到尾我也沒說以這個來衡量吧?還有Futuremark的東西我早就是看看就好了,PCMark本來就沒價值。

還有P4開了HT很快,平時吃鱉?平時有多少個是會用到HT這個功能的而增強效能的,HT開下去搞不好還減少效能一點點,但是你能否認若這個軟體完全針對HT編寫狀況還是這樣嗎?看Sisoftsandra的數值我只能告訴你要先預設立場,他這種測試法是建立在某些特定條件基準之上,還有根據我實測,沒HT的P4就算同時脈也不會等於同時脈同架構的賽揚測出來的數據,實際上就不同了,他的資料庫有沒有問題我不知道,但我知道測出來有落差是事實。測試有角度,看你要怎樣解讀,主觀的去看不是很公平吧?基本上SR2a的sandra還是有參考性,像SR3他把SSE2跟一般的數據合成SSE2的,但是你能說他就都偏袒P4??若比上SSE2這個東西確實數據出來就這樣,就算他偏袒也未必不是某個角度的事實。

如果今天Intel完全主導市場軟體,通通用它的指令集來寫,那狀況是怎樣?

K8同時脈確實有比K7優良,但還沒什麼強太多這種道理,不要太神話K8,我對於很久遠的P3跟K7原來架構不是很清楚,感謝你告訴我差異。

還有70樓的阿,不是我想說,你這個地方的人都是這樣的嗎?Dell要賣只不過基於利潤,就這麼簡單,為商之道首重利,東西好壞不在考量範圍。大家都賣他不賣比別人少賺,就這麼簡單。看了上面的東西我只能說像你這樣說等於就是選擇性的相信,符合你胃口的就說好,看了不順眼就喊打,唉~~

Adsmt 2005-11-23 03:49 AM

引用:
作者ianme
若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。

L1, L2 是不同的東西,即使拿來挪用也不可能視為相等。L1 屬於 CPU 核心的部份,這點是和 L2 最大的差異,同時增加 L1 會使時脈提升困難。

引用:
作者ianme
我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越...

所以才說不能一概而論,以 P4, K8 而言,L1 cache 的 latency 是差不多的,既然 avg. latency 不相上下,那大的不是佔了優勢了嗎?
而且,如下圖:
Plot of miss rate versus cache size for various associativities.
不管是什麼 associativities 最佳的 miss rate 和 cache size 大約座落在 64K~256K 之間。
當然這不一定是絕對,而且這台測試的機器是 SPEC CPU2000, 但至少可以做個參考......

will0227 2005-11-23 08:04 AM

引用:
作者ianme
還有P4開了HT很快,平時吃鱉?平時有多少個是會用到HT這個功能的而增強效能的,HT開下去搞不好還減少效能一點點,但是你能否認若這個軟體完全針對HT編寫狀況還是這樣嗎?看Sisoftsandra的數值我只能告訴你要先預設立場,他這種測試法是建立在某些特定條件基準之上,還有根據我實測,沒HT的P4就算同時脈也不會等於同時脈同架構的賽揚測出來的數據,實際上就不同了,他的資料庫有沒有問題我不知道,但我知道測出來有落差是事實。測試有角度,看你要怎樣解讀,主觀的去看不是很公平吧?基本上SR2a的sandra還是有參考性,像SR3他把SSE2跟一般的數據合成SSE2的,但是你能說他就都偏袒P4??若比上SSE2這個東西確實數據出來就這樣,就算他偏袒也未必不是某個角度的事實。

如果今天Intel完全主導市場軟體,通通用它的指令集來寫,那狀況是怎樣?

K8同時脈確實有比K7優良,但還沒什麼強太多這種道理,不要太神話K8,我對於很久遠的P3跟K7原來架構不是很清楚,感謝你告訴我差異。

還有70樓的阿,不是我想說,你這個地方的人都是這樣的嗎?Dell要賣只不過基於利潤,就這麼簡單,為商之道首重利,東西好壞不在考量範圍。大家都賣他不賣比別人少賺,就這麼簡單。看了上面的東西我只能說像你這樣說等於就是選擇性的相信,符合你胃口的就說好,看了不順眼就喊打,唉~~...

P4會賣其實HT佔很大的原因好不好...Dell會賣是基於利潤沒錯,我想說的是如果K8和K7根本差不多,那Dell為何會倒戈來賣??基本上intel給Dell的處裡器"價格"都很優惠,沒必要冒風險去賣AMD的呀,你有沒有想過為什麼??最近還有新聞指出在美國零售市場K8甚至賣的比P4還要來的好,AMD的產能跟Intel比起來真的差太多了,也持續缺貨你說P4和K8純粹只是耗電量(發熱量?)及價格因數的差別而已?真有這麼簡單嗎?K8會便宜嗎....一顆6-7千的入門K8大賣你竟然說是價格因數.....你好像不清楚K8 X2系列剛推出造成轟動當天賣光的熱潮....如果純然是價格因數的話,你可以解釋一下為什麼一顆最少接近2萬(那時候沒3800+)到3萬多的CPU會瞬間賣光的原因嗎??P4的XE系列價格也是差不多,為什麼沒有造成轟動大賣??只是因為發熱量而已嗎?
再來你還說如果今天Intel完全主導市場軟體,通通用它的指令集來寫,那狀況是怎樣?看了上面的東西我只能說像你這樣說等於就是選擇性的相信,符合你胃口的就說好,看了不順眼就喊打,唉這兩句,你說我是選擇性相信??我覺得你才是,至少我看的是國際大廠的動向,消費者選購的取向,還有實測效能不是光看測試軟體.....你只看測試軟體卻說我選擇性相信??反了吧,還說如果通通用intel的指令集來寫.....還如果哩 :jolin: :shock:

Vincent.Chan 2005-11-23 08:30 AM

CPU:Celeron D 2.4GHz D0核心跑180.1外頻OK 約等於L2=256K 無Hyper-Threading的P4 540


好強的CPU @@"


我已經想把k8拿去丟了 .............XD



某軟體 本來就是 "眾所公認" 對I社有最佳化 .........

還能說測出來多公正 @@?

無言

GXroots 2005-11-23 08:36 AM

引用:
作者ianme
快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會,2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大,那會造成資料若是不同於記憶體裡面,假設較舊的時後,變成整個那一段都要提取進來,造成時間的浪費,只要用到其中一個卻提取一堆,相反的way數越多,做的其實不必那麼大,快取目的在於減少不必要的等待,在記憶體潛伏裡面去做快取的動作,需要的是快速也就是大量的頻寬跟資料的正確性,還有是否為最新的資料,大不見的就是好,若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。

我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越...


不懂裝懂...
半瓶水響叮噹...

RogerShih 2005-11-23 10:35 AM

引用:
作者ianme
快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會,2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大,那會造成資料若是不同於記憶體裡面,假設較舊的時後,變成整個那一段都要提取進來,造成時間的浪費,只要用到其中一個卻提取一堆,相反的way數越多,做的其實不必那麼大,快取目的在於減少不必要的等待,在記憶體潛伏裡面去做快取的動作,需要的是快速也就是大量的頻寬跟資料的正確性,還有是否為最新的資料,大不見的就是好,若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。

我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越...


我怎麼覺得看到另一個妞妞.... :stupefy:

AMD 的 K8 說來的確也沒有什麼了不起, 只是做了一些小改進, 把一些看似沒什麼了不起的東西放進去, 如此而已罷了. 只是 Intel 在 Italium 跟 P4 繞太大的圈子了, Intel 自己大頭症發作, 以為自己想怎樣就怎樣, 不管業界的觀感跟想法, 自己挖坑自己跳, 有什麼好埋怨的!?

Rambus 花掉多少時間!?P4 跟 Italium 一直想把 x86 的 CISC 去掉, 去到最後, 還是走 P4-M 架構, 又花掉多少時間?

一進一退, 還說得出 K8 跟 P4 架構沒差?x86-64 指令集本來 Intel 最有機會主導, 現在卻是東施效顰, 搞得 EMT64 根本沒多大差別, 跟著人家的 x86-64 跑, 徒然讓人看笑話.

講一般的消費印象, K8 的熱量也大幅改善, dual core-3800+ 用原廠散熱器, 室溫 30, 待機40, 全速 50, 夠涼了, 也代表 K8 完全讓使用者改觀. 而用比較低的真實時脈, 就可以比更高時脈的 P4 達到更高的效能, 如果還可以說沒差別, 那不是自欺欺人!?

我不喜歡神話那一邊, 只是真的別不懂裝懂.

jasonyang 2005-11-23 11:02 AM

引用:
作者ianme
快取不就是為了提升效率?那麼增加way可以有效減少miss rate的機會,2-way跟8-way
的miss rate雖說相差不遠還是有差。再說若是過大,那會造成資料若是不同於記憶體裡面,假設較舊的時後,變成整個那一段都要提取進來,造成時間的浪費,只要用到其中一個卻提取一堆,相反的way數越多,做的其實不必那麼大,快取目的在於減少不必要的等待,在記憶體潛伏裡面去做快取的動作,需要的是快速也就是大量的頻寬跟資料的正確性,還有是否為最新的資料,大不見的就是好,若是L1越大就會提升效能那我相信要做大絕對不是難事,甚至可以挪用L2這部份來增加L1容量,太大會增加miss penalty並且造成低利用率。

我在看你貼的資料裡面找到:Also, larger caches are slower (bigger search space). 位於section 16.5第2段,接下來第3段可說是印證我的論點,大不見得比較好,他只告訴你小會比較慢,沒告訴你大會比較快。L1越...


set associative way 數越大的確 hit rate 越接近 fully associative,但我早說過這是廠商在成本與效能間的取捨,不然全部都做成 fully associative 就好了,不是嗎? 況且決定性能的最主要因素還是 hit rate 和頻寬與 latency,n-way set assocative 也只是影響 hit rate 外,還有快取大小等其他因素。

至於那段話並無法印證你說的話,因為你根本斷章取義,沒看前後文。他說的 slower 我想是指 latency 需越大,而他後面說的很清楚,快取還是越做越大,因為提高 hit rate,提升 cpu 性能。還舉了快取太小,不同的 processor 會競爭快取的問題,我想是 cache threshing 的意思。

Hyperthreading 這東西不錯,IBM 也在 Power5 上實做 SMT,而 p4 在 SPEC 有些伺服器性能 benchmark 上有令人不可思議的大成長,不過像 Ace's hardware 上的實測,在 database/web server 上也的確有性能成長 15% 左右,不過還是比 opteron 差多了。其他網站測很多 3D rendering/video encoding 也有 25% 左右的性能成長,這邊 amd 打的比較吃力,因為這是單核 p4 極少數的強項,這點是 AMD 所缺乏的。

在 x86 的軟體上,目前就是 Intel 主導的市場,幾乎所有的程式用的 compiler 都是以 pentium 或 pentium4 來最佳化,事實上早就已經在偏袒 intel 系統,但我認為這是沒辦法的是,誰較 amd 是要去搶人家市場的人。我想常常有許多人把 MMX/SSE/SSE2/SSE3 以為可以讓所有程式都最佳化的錯誤觀念,這些擴充指令集,以前叫向量運算,只能針對能夠大量平行的數值運算,所以不能有太大的資料相依性影響能夠平行的機會,而一般的文書處理、檔案壓縮、程式編譯、伺服器等運用,無法用這些東西最佳化,該做的 intel 早就推廣了,像是 video/audio encoding 與 3D rendering 與 3D game,SSE 已經推出三四年以上了,能最佳化的早最佳化的差不多了。

will0227 2005-11-23 11:55 AM

引用:
作者RogerShih
我怎麼覺得看到另一個妞妞.... :stupefy:

AMD 的 K8 說來的確也沒有什麼了不起, 只是做了一些小改進, 把一些看似沒什麼了不起的東西放進去, 如此而已罷了. 只是 Intel 在 Italium 跟 P4 繞太大的圈子了, Intel 自己大頭症發作, 以為自己想怎樣就怎樣, 不管業界的觀感跟想法, 自己挖坑自己跳, 有什麼好埋怨的!?

Rambus 花掉多少時間!?P4 跟 Italium 一直想把 x86 的 CISC 去掉, 去到最後, 還是走 P4-M架構, 又花掉多少時間?

一進一退, 還說得出 K8 跟 P4 架構沒差?x86-64 指令集本來 Intel 最有機會主導, 現在卻是東施效顰, 搞得 EMT64 根本沒多大差別, 跟著人家的 x86-64 跑, 徒然讓人看笑話.

講一般的消費印象, K8 的熱量也大幅改善, dual core-3800+ 用原廠散熱器, 室溫 30, 待機40, 全速 50, 夠涼了, 也代表 K8 完全讓使用者改觀. 而用比較低的真實時脈, 就可以比更高時脈的 P4 達到更高...
不好意思,這裡是指P4 -M還是P-M...? :)

alience 2005-11-23 11:55 AM

引用:
作者ianme
測這兩個值跟CPU快慢沒有絕對關係,但是很明顯,在於這兩項裡面,K8跟K7的狀況是一樣地,我並沒有說K8跟K7速度一樣,要搞清楚,MIPs的能力不完全正比於CPU能力,這個我之前就有這樣說過(不是這一篇),但是你不可否認這兩項是衡量CPU的指標,就好比時脈不等於效能,但時脈就不是效能的衡量指標嗎?K8在快的部份是快在哪裡,如果都認不清,我也不知道該說什麼..

還有我重點不是跟你談Benchmark,尤其不是Sisoftsandra這個東西,從頭到尾我也沒說以這個來衡量吧?還有Futuremark的東西我早就是看看就好了,PCMark本來就沒價值。

還有P4開了HT很快,平時吃鱉?平時有多少個是會用到HT這個功能的而增強效能的,HT開下去搞不好還減少效能一點點,但是你能否認若這個軟體完全針對HT編寫狀況還是這樣嗎?看Sisoftsandra的數值我只能告訴你要先預設立場,他這種測試法是建立在某些特定條件基準之上,還有根據我實測...


衡量cpu的指標??
那大概只能看到一件事=>HT是神
k8比起k7沒有改善很多@@..我可不懂你的沒有改善很多是啥意思
當然總體來說同時脈大約"只"提升25%上下
可是我跑matlab時,有某些case可以令k8 2.2g比l7 1.83g快一倍
同樣的情況也發生在winrar上
沒有人在神話k8,但是k8和k7的確等級差了一大截
然而在sisoftsandra上看不見,因此而說k8換湯不換藥@@
有點...................

龍之介 2005-11-23 12:00 PM

個人覺得K8的優點是就是低溫,低時脈也比P4耗電要低,
這應該是DELL等大廠用AMD的主因,效能的因素應該是次要的
現在的CPU效能有那麼重要嗎?主機耗電跟溫度如果不控制其他零件也跟著遭殃
價錢是跟者大廠的品牌與服務搭在一起的,當然會適度改變有所取捨
我想DELL應該不會不懂這個道理,未來INTEL絕對會以降溫低耗電為目標
如果真的這些大廠以效能作為出貨取向,那P3時代應該K7是大廠的最愛吧
這些什麼指令真的有那麼重要嗎?不是每台電腦都是實驗室要用的
依照AMD慣例主流CPU價格應該會比較平易近人,但在K8這現象現在還沒看到
這也意味著未來幾年電腦的使用與習慣有可能漸漸改變,就看INTEL怎麼挽救吧


所有的時間均為GMT +8。 現在的時間是12:13 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。