![]() |
||
Amateur Member
![]() 加入日期: Nov 2002 您的住址: 台中
文章: 42
|
其實我也好奇了很久...
你看這個, http://store.sun.com/CMTemplate/CES...eferrer=ssh_buy 時脈才 1.28G 的 CPU, 又這麼貴... 引用:
__________________
寂寞生魚片 |
||||||||
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: Feb 2004 您的住址: 從來處來
文章: 2,765
|
引用:
這確實不只是頻寬的問題,而是 L1, L2 先天上的差異。 L1 是屬於 CPU 核心的一部份(現在 CPU 的 L2 也都是做在 die 裡,但並不屬於 CPU 核心),在速度上大約是 L2 的十倍左右,因此如果 access L1 miss 的話,就必須付出慘痛的代價(另外花十倍的時間去存取 L2),因此如果能有效地降低 L1 access 的 miss rate 對效能將有極大的影響。 看這裡的圖表 http://www.tomshardware.com/cpu/200...al_xeon-02.html 這張圖表很簡單地表示出了電腦各個記憶體階層的差異,就如在主記憶體上找不到資料而必須到硬碟上找時,因為硬碟的效能遠不如記憶體而必須付出慘痛的效能代價一樣。L1 的大小對於效能有決定性的影響,不過影響多少是很難一概而論的。因為光是 cache 的設計差異也會有很大的影響。(但至少以 P4, K8 的設計差異,L1 是有決定性的影響的,不然光是 pepeline stall 就足以造成 3GHz = 1.8GHz, 那 Intel 的那些工程師也太遜了點.......) 原則上 L1 越大越好是一定的,因為它是最快的,這個道理就像 RAM 愈大好愈好一樣。但前面講過 L1 的大小會影響核心時脈的提升,因此 L1 愈大,時脈提升會愈困難,反之亦然。這也是 P4, K8 所走的不同路線。 |
|||
![]() |
![]() |
Major Member
![]() 加入日期: Sep 2004 您的住址: 木柵動物園
文章: 293
|
引用:
時脈與效能的觀念,建議你在多看幾遍我講的,看不懂可以問,不要看不懂就否認,也可以用 google 找資料,有許多可以找。 http://arstechnica.com/articles/paedia/cpu.ars http://www.aceshardware.com/list.jsp?id=4 http://www.chip-architect.com/ http://www.realworldtech.com/index.cfm k8 與 k3 架構是兩回事,k8 是改進 k7 架構,我只能說你的觀念有許多問題,感覺是拼湊而成,有許多錯誤要花多時間跟你解釋,我當然知道什麼是 superscaler,不懂的是你,我可以建議你一些不錯的網站,像是 Ace's hardware, Tech Report, Ars Technica,多看看對你會有幫助。 superscaler 中文譯名是超純量,其實就是使用多條 pipeline 來 "序列化" 執行指令,所以是 ILP (Instruction Level Parallelism),而早期 IBM 最早做出 out-of-order execution,因為 RISC 觀念是 IBM 發明的,其他廠商設計成較簡單的 In-order execution 設計。 pipeline 就像生產線觀念一樣,打指令拆成許多細部動作,是 RISC 觀念下的產物,使得平均一個週期發出一個指令(實際上還是花了需多 cycle)。 分支預測錯誤不是 p4 獨有的,是有分支預測單元的 cpu 都會遇到的,只是 p4 太長的 pipeline 造成性能損失(Misprediction Penalty) 比其他 cpu 都大太多了,而分支預測錯誤與 L1 cache 是毫無關係的。更不是什麼不需要那麼多級的想法,我想我舉得網站上都有許多討論,請自行看看吧!! p4 能在簡單的並可平行的運算上性能勝過 k8/pm,或是像是 FFT,DCT,matrix 這種運算,不管資料怎麼變,演算法與程式的流程的一樣,大大減少分支預測錯誤的發生,但是一扯到複雜的運算,或與資料相依等,因為 Misprediction Penalty 太高,導致性能大降。這就是為什麼 p4 在 AI(alpha-beta search)、compiler(hash table、parsing、 finite-state-machine)、database/web server 等上表現不佳的原因。 |
|
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Dec 2000 您的住址: Cambridge Law School
文章: 1,780
|
Prescott的分支遇測比Northwood好,但是Cache延遲與記憶體延遲就輸了K8,甚至256KB的OEM S939 Sempron,要看到多核心對PC遊戲的好處還要一段時間,Intel的態度是未來高階CPU整合MC,中低階還是不採用,Prescott的ALU部份是2倍核心頻率,造成了廢熱,未來的GPU也要面對這樣的問題
__________________
£500 per day, low-wage labour ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Dec 2000 您的住址: Cambridge Law School
文章: 1,780
|
引用:
你說錯了,Prescott的Misprediction比Northwood好,你去問PCHOME的Waterball好了 haha
__________________
£500 per day, low-wage labour ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
|
![]() |
![]() |
Major Member
![]() 加入日期: Sep 2004 您的住址: 木柵動物園
文章: 293
|
至於快取的問題,快取的發明,主要還是因為 Instruction 與 data 有區域性 (locality),程式不是從頭跑到尾,而是會再某些片段內(主要是微觀的 branch、loop,巨觀的像是 function/subroutine call)花了大部分的時間,資料也不是隨機的存取,而是在最近取用的資料附近,所以才有 cache 的發明,用更高速且昂貴的記憶體,來提升性能。
快取的性能,不是只有 bandwidth 來決定,還有 latency、快取演算法(通常是LRU) 與 hit rate(跟 size 有極大的關係) 等。 此文章於 2005-11-20 12:30 PM 被 jasonyang 編輯. |
![]() |
![]() |
Major Member
![]() 加入日期: Sep 2004 您的住址: 木柵動物園
文章: 293
|
引用:
我哪裡說錯的,歡迎指教? 不過我想該請教的是你不是我吧!!! 我並沒有說 prescott 的 misprediction 比 northwood 好或差啊!! 而且更重要的性能的損失不是單純在 mispredition 上,而是 mispredition penalty 上。 基本上我比較相信 Ars Technica、Ace's hardware, Tech Report, AnandTech, Chip Architechure 或 RWT 等上有事實根據或數據分析,不是隨口說說或人云亦云,而且台灣雜誌 intel 與商業色彩太濃厚,且錯誤太多,我比較相信教科書、期刊與眾多國外網站上(不要只看一家)的東西。 此文章於 2005-11-20 12:45 PM 被 jasonyang 編輯. |
|
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: May 2002
文章: 3,163
|
waterball 喔∼滿屌的
那個人的網站 http://molesterwaterball.blogspot.com/ 主站 http://www.ithome.com.tw/plog/index.php?blogId=24 分部
__________________
往事只能回憶 此文章於 2005-11-20 12:32 PM 被 vandenbroucke 編輯. |
![]() |
![]() |
Basic Member
加入日期: Apr 2005
文章: 24
|
引用:
看到這篇讓我想起來我有個同學也問過類似的問題 請問同樣都是開機那"磁碟開機"比較快還是"光碟開機".... ![]() 頓時讓我不知如何回答 ![]() |
|
![]() |
![]() |
*停權中*
加入日期: Aug 2004 您的住址: 見你個大頭鬼!
文章: 225
|
BMW M3也是3000c.c.
BMW 330ci也是3000c.c. 為啥M3一台要三四百萬 330ci只要兩百多萬 拿來跟toyota比就更明顯了呀 camary也有3000c.c的為啥才賣一百萬左右 同樣都是3000c.c的車 你說說看呀你說說看呀??? 這三台車的極速跟加速度會一樣嗎? 機械結構會一樣嗎?? |
![]() |
![]() |