PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 系統組件
帳戶
密碼
 

  回應
 
主題工具
rickie
Amateur Member
 

加入日期: Nov 2002
您的住址: 台中
文章: 42
其實我也好奇了很久...
你看這個, http://store.sun.com/CMTemplate/CES...eferrer=ssh_buy
時脈才 1.28G 的 CPU, 又這麼貴...

引用:
作者harold0507
k8 3000 的時脈不是1800嗎?

p4 1.8g 不也是1800嗎?

不都是L2 512K嗎?

那請問為什麼k8那麼貴?
     
      
__________________
寂寞生魚片
舊 2005-11-20, 05:03 AM #51
回應時引用此文章
rickie離線中  
Adsmt
Golden Member
 
Adsmt的大頭照
 

加入日期: Feb 2004
您的住址: 從來處來
文章: 2,765
引用:
作者ianme
K8架構L1是2way,分成 Instruction跟Data,P4是8way的16KB data跟12Kups的trace(類似指令快取嗎??),L2方式也不同,資料存取首重效率,頻寬不見得是主因,這不是什麼單純比大小的東西吧?Intel好像也表示他們的L1做大不一定比較快。且K8是因為L2頻寬大約8xxxMB/s,記憶體就跑59xxMB/s(雙通DDR400),跟L2頻寬也差不了多少。相比之下P4就少很多了,從L2到memory差了不少。

這確實不只是頻寬的問題,而是 L1, L2 先天上的差異。
L1 是屬於 CPU 核心的一部份(現在 CPU 的 L2 也都是做在 die 裡,但並不屬於 CPU 核心),在速度上大約是 L2 的十倍左右,因此如果 access L1 miss 的話,就必須付出慘痛的代價(另外花十倍的時間去存取 L2),因此如果能有效地降低 L1 access 的 miss rate 對效能將有極大的影響。

看這裡的圖表
http://www.tomshardware.com/cpu/200...al_xeon-02.html
這張圖表很簡單地表示出了電腦各個記憶體階層的差異,就如在主記憶體上找不到資料而必須到硬碟上找時,因為硬碟的效能遠不如記憶體而必須付出慘痛的效能代價一樣。L1 的大小對於效能有決定性的影響,不過影響多少是很難一概而論的。因為光是 cache 的設計差異也會有很大的影響。(但至少以 P4, K8 的設計差異,L1 是有決定性的影響的,不然光是 pepeline stall 就足以造成 3GHz = 1.8GHz, 那 Intel 的那些工程師也太遜了點.......)

原則上 L1 越大越好是一定的,因為它是最快的,這個道理就像 RAM 愈大好愈好一樣。但前面講過 L1 的大小會影響核心時脈的提升,因此 L1 愈大,時脈提升會愈困難,反之亦然。這也是 P4, K8 所走的不同路線。
 
舊 2005-11-20, 10:39 AM #52
回應時引用此文章
Adsmt離線中  
jasonyang
Major Member
 

加入日期: Sep 2004
您的住址: 木柵動物園
文章: 293
引用:
作者ianme
你確定P4走低效率路線....,還有時脈等於效能,就好比我說雞蛋你跟我說鴨蛋...還扯上外頻...我無言。講時脈就是指內頻,哪有人還要把它拆開來說的?

K8只不過就從P3架構去加強每一點,製程進步這樣而已,設計??你能拿出怎樣的設計,大家都是這樣設計,不是全軟全硬那不然就是各來一部份。不要拿出一堆好像很專業的東西,superscaler是什麼你清楚嗎?不就是再度將單一個單元用pipeline而已。pipeline數量??

有什麼東西可以證明P4分支預測常常錯誤,還有Sisoftsandra裡面,P4並沒有佔到多少優勢,很多時候測出來都比較低,同一級產品底下。NetBurst架構底下,並不是效率不彰的問題,是在於根本不需要那麼多級指令就結束了,這跟效率不彰不能完全混為一談。至於預測錯誤我認為Intel在這上面下了長足苦工,光看L1設計就可見一般。


時脈與效能的觀念,建議你在多看幾遍我講的,看不懂可以問,不要看不懂就否認,也可以用 google 找資料,有許多可以找。

http://arstechnica.com/articles/paedia/cpu.ars
http://www.aceshardware.com/list.jsp?id=4
http://www.chip-architect.com/
http://www.realworldtech.com/index.cfm
k8 與 k3 架構是兩回事,k8 是改進 k7 架構,我只能說你的觀念有許多問題,感覺是拼湊而成,有許多錯誤要花多時間跟你解釋,我當然知道什麼是 superscaler,不懂的是你,我可以建議你一些不錯的網站,像是 Ace's hardware, Tech Report, Ars Technica,多看看對你會有幫助。

superscaler 中文譯名是超純量,其實就是使用多條 pipeline 來 "序列化" 執行指令,所以是 ILP (Instruction Level Parallelism),而早期 IBM 最早做出 out-of-order execution,因為 RISC 觀念是 IBM 發明的,其他廠商設計成較簡單的 In-order execution 設計。
pipeline 就像生產線觀念一樣,打指令拆成許多細部動作,是 RISC 觀念下的產物,使得平均一個週期發出一個指令(實際上還是花了需多 cycle)。

分支預測錯誤不是 p4 獨有的,是有分支預測單元的 cpu 都會遇到的,只是 p4 太長的 pipeline 造成性能損失(Misprediction Penalty) 比其他 cpu 都大太多了,而分支預測錯誤與 L1 cache 是毫無關係的。更不是什麼不需要那麼多級的想法,我想我舉得網站上都有許多討論,請自行看看吧!!
p4 能在簡單的並可平行的運算上性能勝過 k8/pm,或是像是 FFT,DCT,matrix 這種運算,不管資料怎麼變,演算法與程式的流程的一樣,大大減少分支預測錯誤的發生,但是一扯到複雜的運算,或與資料相依等,因為 Misprediction Penalty 太高,導致性能大降。這就是為什麼 p4 在 AI(alpha-beta search)、compiler(hash table、parsing、 finite-state-machine)、database/web server 等上表現不佳的原因。
舊 2005-11-20, 11:48 AM #53
回應時引用此文章
jasonyang離線中  
samsung
Master Member
 

加入日期: Dec 2000
您的住址: Cambridge Law School
文章: 1,780
Prescott的分支遇測比Northwood好,但是Cache延遲與記憶體延遲就輸了K8,甚至256KB的OEM S939 Sempron,要看到多核心對PC遊戲的好處還要一段時間,Intel的態度是未來高階CPU整合MC,中低階還是不採用,Prescott的ALU部份是2倍核心頻率,造成了廢熱,未來的GPU也要面對這樣的問題
__________________
£500 per day, low-wage labour
舊 2005-11-20, 11:57 AM #54
回應時引用此文章
samsung離線中  
samsung
Master Member
 

加入日期: Dec 2000
您的住址: Cambridge Law School
文章: 1,780
引用:
作者jasonyang
時脈與效能的觀念,建議你在多看幾遍我講的,看不懂可以問,不要看不懂就否認,也可以用 google 找資料,有許多可以找。

http://arstechnica.com/articles/paedia/cpu.ars
http://www.aceshardware.com/list.jsp?id=4
http://www.chip-architect.com/
http://www.realworldtech.com/index.cfm
k8 與 k3 架構是兩回事,k8 是改進 k7 架構,我只能說你的觀念有許多問題,感覺是拼湊而成,有許多錯誤要花多時間跟你解釋,我當然知道什麼是 superscaler,不懂的是你,我可以建議你一些不錯的網站,像是 Ace's hardware, Tech Report, Ars Technica,多看看對你會有幫助。

superscaler 中文譯名是超純量,其實就是使用多條 pipeline 來 "序列化" 執行指令,所以是 ILP (Instruction Level Parallelism),而早期 IBM 最早做出 out-of-order execution,因為 RISC 觀念是 IBM 發明的,其他廠商...


你說錯了,Prescott的Misprediction比Northwood好,你去問PCHOME的Waterball好了
haha
__________________
£500 per day, low-wage labour
舊 2005-11-20, 12:03 PM #55
回應時引用此文章
samsung離線中  
jasonyang
Major Member
 

加入日期: Sep 2004
您的住址: 木柵動物園
文章: 293
至於快取的問題,快取的發明,主要還是因為 Instruction 與 data 有區域性 (locality),程式不是從頭跑到尾,而是會再某些片段內(主要是微觀的 branch、loop,巨觀的像是 function/subroutine call)花了大部分的時間,資料也不是隨機的存取,而是在最近取用的資料附近,所以才有 cache 的發明,用更高速且昂貴的記憶體,來提升性能。
快取的性能,不是只有 bandwidth 來決定,還有 latency、快取演算法(通常是LRU) 與 hit rate(跟 size 有極大的關係) 等。

此文章於 2005-11-20 12:30 PM 被 jasonyang 編輯.
舊 2005-11-20, 12:09 PM #56
回應時引用此文章
jasonyang離線中  
jasonyang
Major Member
 

加入日期: Sep 2004
您的住址: 木柵動物園
文章: 293
引用:
作者samsung
你說錯了,Prescott的Misprediction比Northwood好,你去問PCHOME的Waterball好了
haha


我哪裡說錯的,歡迎指教? 不過我想該請教的是你不是我吧!!!
我並沒有說 prescott 的 misprediction 比 northwood 好或差啊!!
而且更重要的性能的損失不是單純在 mispredition 上,而是 mispredition penalty 上。
基本上我比較相信 Ars Technica、Ace's hardware, Tech Report, AnandTech, Chip Architechure 或 RWT 等上有事實根據或數據分析,不是隨口說說或人云亦云,而且台灣雜誌 intel 與商業色彩太濃厚,且錯誤太多,我比較相信教科書、期刊與眾多國外網站上(不要只看一家)的東西。

此文章於 2005-11-20 12:45 PM 被 jasonyang 編輯.
舊 2005-11-20, 12:11 PM #57
回應時引用此文章
jasonyang離線中  
vandenbroucke
Golden Member
 
vandenbroucke的大頭照
 

加入日期: May 2002
文章: 3,163
waterball 喔∼滿屌的

那個人的網站
http://molesterwaterball.blogspot.com/ 主站
http://www.ithome.com.tw/plog/index.php?blogId=24 分部
__________________
往事只能回憶

此文章於 2005-11-20 12:32 PM 被 vandenbroucke 編輯.
舊 2005-11-20, 12:29 PM #58
回應時引用此文章
vandenbroucke離線中  
sonic11s
Basic Member
 

加入日期: Apr 2005
文章: 24
引用:
作者harold0507
k8 3000 的時脈不是1800嗎?

p4 1.8g 不也是1800嗎?

不都是L2 512K嗎?

那請問為什麼k8那麼貴?


看到這篇讓我想起來我有個同學也問過類似的問題

請問同樣都是開機那"磁碟開機"比較快還是"光碟開機"....
頓時讓我不知如何回答
舊 2005-11-20, 02:41 PM #59
回應時引用此文章
sonic11s離線中  
perfectg2606
*停權中*
 
perfectg2606的大頭照
 

加入日期: Aug 2004
您的住址: 見你個大頭鬼!
文章: 225
BMW M3也是3000c.c.
BMW 330ci也是3000c.c.
為啥M3一台要三四百萬
330ci只要兩百多萬
拿來跟toyota比就更明顯了呀
camary也有3000c.c的為啥才賣一百萬左右
同樣都是3000c.c的車
你說說看呀你說說看呀???

這三台車的極速跟加速度會一樣嗎?
機械結構會一樣嗎??
舊 2005-11-20, 02:50 PM #60
回應時引用此文章
perfectg2606離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是07:58 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。