一個笨笨的想法(對k8) - PCDVD數位科技討論區

		PCDVD數位科技討論區 > 電腦硬體討論群組 > 系統組件
一個笨笨的想法(對k8)

第6頁共12頁

« 第一

最後 »

主題工具

rickie

Amateur Member

加入日期: Nov 2002

您的住址: 台中

文章: 42

其實我也好奇了很久...
你看這個, http://store.sun.com/CMTemplate/CES...eferrer=ssh_buy
時脈才 1.28G 的 CPU, 又這麼貴...

引用:

作者harold0507

k8 3000 的時脈不是1800嗎?

p4 1.8g 不也是1800嗎?

不都是L2 512K嗎?

那請問為什麼k8那麼貴?

__________________
寂寞生魚片

2005-11-20, 05:03 AM #51

Adsmt

Golden Member

加入日期: Feb 2004

您的住址: 從來處來

文章: 2,765

引用:

作者ianme

K8架構L1是2way，分成 Instruction跟Data，P4是8way的16KB data跟12Kups的trace(類似指令快取嗎??)，L2方式也不同，資料存取首重效率，頻寬不見得是主因，這不是什麼單純比大小的東西吧?Intel好像也表示他們的L1做大不一定比較快。且K8是因為L2頻寬大約8xxxMB/s，記憶體就跑59xxMB/s(雙通DDR400)，跟L2頻寬也差不了多少。相比之下P4就少很多了，從L2到memory差了不少。

這確實不只是頻寬的問題，而是 L1, L2 先天上的差異。
L1 是屬於 CPU 核心的一部份（現在 CPU 的 L2 也都是做在 die 裡，但並不屬於 CPU 核心），在速度上大約是 L2 的十倍左右，因此如果 access L1 miss 的話，就必須付出慘痛的代價（另外花十倍的時間去存取 L2），因此如果能有效地降低 L1 access 的 miss rate 對效能將有極大的影響。

看這裡的圖表
http://www.tomshardware.com/cpu/200...al_xeon-02.html
這張圖表很簡單地表示出了電腦各個記憶體階層的差異，就如在主記憶體上找不到資料而必須到硬碟上找時，因為硬碟的效能遠不如記憶體而必須付出慘痛的效能代價一樣。L1 的大小對於效能有決定性的影響，不過影響多少是很難一概而論的。因為光是 cache 的設計差異也會有很大的影響。（但至少以 P4, K8 的設計差異，L1 是有決定性的影響的，不然光是 pepeline stall 就足以造成 3GHz = 1.8GHz, 那 Intel 的那些工程師也太遜了點.......）

原則上 L1 越大越好是一定的，因為它是最快的，這個道理就像 RAM 愈大好愈好一樣。但前面講過 L1 的大小會影響核心時脈的提升，因此 L1 愈大，時脈提升會愈困難，反之亦然。這也是 P4, K8 所走的不同路線。

2005-11-20, 10:39 AM #52

jasonyang

Major Member

加入日期: Sep 2004

您的住址: 木柵動物園

文章: 293

引用:

作者ianme

你確定P4走低效率路線....，還有時脈等於效能，就好比我說雞蛋你跟我說鴨蛋...還扯上外頻...我無言。講時脈就是指內頻，哪有人還要把它拆開來說的?

K8只不過就從P3架構去加強每一點，製程進步這樣而已，設計??你能拿出怎樣的設計，大家都是這樣設計，不是全軟全硬那不然就是各來一部份。不要拿出一堆好像很專業的東西，superscaler是什麼你清楚嗎?不就是再度將單一個單元用pipeline而已。pipeline數量??

有什麼東西可以證明P4分支預測常常錯誤，還有Sisoftsandra裡面，P4並沒有佔到多少優勢，很多時候測出來都比較低，同一級產品底下。NetBurst架構底下，並不是效率不彰的問題，是在於根本不需要那麼多級指令就結束了，這跟效率不彰不能完全混為一談。至於預測錯誤我認為Intel在這上面下了長足苦工，光看L1設計就可見一般。

時脈與效能的觀念，建議你在多看幾遍我講的，看不懂可以問，不要看不懂就否認，也可以用 google 找資料，有許多可以找。

http://arstechnica.com/articles/paedia/cpu.ars
http://www.aceshardware.com/list.jsp?id=4
http://www.chip-architect.com/
http://www.realworldtech.com/index.cfm
k8 與 k3 架構是兩回事，k8 是改進 k7 架構，我只能說你的觀念有許多問題，感覺是拼湊而成，有許多錯誤要花多時間跟你解釋，我當然知道什麼是 superscaler，不懂的是你，我可以建議你一些不錯的網站，像是 Ace's hardware, Tech Report, Ars Technica，多看看對你會有幫助。

superscaler 中文譯名是超純量，其實就是使用多條 pipeline 來 "序列化" 執行指令，所以是 ILP (Instruction Level Parallelism)，而早期 IBM 最早做出 out-of-order execution，因為 RISC 觀念是 IBM 發明的，其他廠商設計成較簡單的 In-order execution 設計。
pipeline 就像生產線觀念一樣，打指令拆成許多細部動作，是 RISC 觀念下的產物，使得平均一個週期發出一個指令(實際上還是花了需多 cycle)。

分支預測錯誤不是 p4 獨有的，是有分支預測單元的 cpu 都會遇到的，只是 p4 太長的 pipeline 造成性能損失(Misprediction Penalty) 比其他 cpu 都大太多了，而分支預測錯誤與 L1 cache 是毫無關係的。更不是什麼不需要那麼多級的想法，我想我舉得網站上都有許多討論，請自行看看吧!!
p4 能在簡單的並可平行的運算上性能勝過 k8/pm，或是像是 FFT,DCT,matrix 這種運算，不管資料怎麼變，演算法與程式的流程的一樣，大大減少分支預測錯誤的發生，但是一扯到複雜的運算，或與資料相依等，因為 Misprediction Penalty 太高，導致性能大降。這就是為什麼 p4 在 AI(alpha-beta search)、compiler(hash table、parsing、 finite-state-machine)、database/web server 等上表現不佳的原因。

2005-11-20, 11:48 AM #53

samsung Master Member 加入日期: Dec 2000 您的住址: Cambridge Law School 文章: 1,780	Prescott的分支遇測比Northwood好,但是Cache延遲與記憶體延遲就輸了K8,甚至256KB的OEM S939 Sempron,要看到多核心對PC遊戲的好處還要一段時間,Intel的態度是未來高階CPU整合MC,中低階還是不採用,Prescott的ALU部份是2倍核心頻率,造成了廢熱,未來的GPU也要面對這樣的問題 __________________ ￡500 per day, low-wage labour
2005-11-20, 11:57 AM #54

samsung

Master Member

加入日期: Dec 2000

您的住址: Cambridge Law School

文章: 1,780

引用:

作者jasonyang

你說錯了,Prescott的Misprediction比Northwood好,你去問PCHOME的Waterball好了
haha

__________________
￡500 per day, low-wage labour

2005-11-20, 12:03 PM #55

jasonyang

Major Member

加入日期: Sep 2004

您的住址: 木柵動物園

文章: 293

至於快取的問題，快取的發明，主要還是因為 Instruction 與 data 有區域性 (locality)，程式不是從頭跑到尾，而是會再某些片段內(主要是微觀的 branch、loop，巨觀的像是 function/subroutine call)花了大部分的時間，資料也不是隨機的存取，而是在最近取用的資料附近，所以才有 cache 的發明，用更高速且昂貴的記憶體，來提升性能。
快取的性能，不是只有 bandwidth 來決定，還有 latency、快取演算法(通常是LRU) 與 hit rate(跟 size 有極大的關係) 等。

此文章於 2005-11-20 12:30 PM 被 jasonyang 編輯.

2005-11-20, 12:09 PM #56

jasonyang

Major Member

加入日期: Sep 2004

您的住址: 木柵動物園

文章: 293

引用:

作者samsung

你說錯了,Prescott的Misprediction比Northwood好,你去問PCHOME的Waterball好了
haha

我哪裡說錯的，歡迎指教? 不過我想該請教的是你不是我吧!!!
我並沒有說 prescott 的 misprediction 比 northwood 好或差啊!!
而且更重要的性能的損失不是單純在 mispredition 上，而是 mispredition penalty 上。
基本上我比較相信 Ars Technica、Ace's hardware, Tech Report, AnandTech, Chip Architechure 或 RWT 等上有事實根據或數據分析，不是隨口說說或人云亦云，而且台灣雜誌 intel 與商業色彩太濃厚，且錯誤太多，我比較相信教科書、期刊與眾多國外網站上(不要只看一家)的東西。

此文章於 2005-11-20 12:45 PM 被 jasonyang 編輯.

2005-11-20, 12:11 PM #57

vandenbroucke Golden Member 加入日期: May 2002 文章: 3,163	waterball 喔～滿屌的那個人的網站 http://molesterwaterball.blogspot.com/　主站 http://www.ithome.com.tw/plog/index.php?blogId=24　分部 __________________ 往事只能回憶此文章於 2005-11-20 12:32 PM 被 vandenbroucke 編輯.
2005-11-20, 12:29 PM #58

sonic11s

Basic Member

加入日期: Apr 2005

文章: 24

引用:

作者harold0507

k8 3000 的時脈不是1800嗎?

p4 1.8g 不也是1800嗎?

不都是L2 512K嗎?

那請問為什麼k8那麼貴?

看到這篇讓我想起來我有個同學也問過類似的問題

請問同樣都是開機那"磁碟開機"比較快還是"光碟開機"....

頓時讓我不知如何回答

2005-11-20, 02:41 PM #59

perfectg2606 停權中加入日期: Aug 2004 您的住址: 見你個大頭鬼! 文章: 225	BMW M3也是3000c.c. BMW 330ci也是3000c.c. 為啥M3一台要三四百萬 330ci只要兩百多萬拿來跟toyota比就更明顯了呀 camary也有3000c.c的為啥才賣一百萬左右同樣都是3000c.c的車你說說看呀你說說看呀??? 這三台車的極速跟加速度會一樣嗎? 機械結構會一樣嗎??
2005-11-20, 02:50 PM #60

第6頁共12頁

« 第一

最後 »

« 上一主題 | 下一主題 »

POPIN

主題工具
顯示可列印版本傳送本頁給好友

發表文章規則
您不可以發起新主題您不可以回應主題您不可以上傳附加檔案您不可以編輯您的文章 vB 代碼打開表情圖示打開 [IMG]代碼打開 HTML代碼關閉

所有的時間均為GMT +8。現在的時間是07:58 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。