PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   4C/8T 和 4C/4T 對單執行緒程式有差嗎 (https://www.pcdvd.com.tw/showthread.php?t=944279)

quickcccc 2011-10-06 10:50 AM

4C/8T 和 4C/4T 對單執行緒程式有差嗎
 
4C/8T 和 4C/4T 對單執行緒程式有差嗎

以 E2200 2.2G 和 Q9500 2.8G 為例

用一支單執行緒程式去試 Q9500 比 E2200 快多少 ?

快 1.27 倍

而 1.27 剛好就是 2.8G / 2.2G 的相除值

換句話說這支 支單執行緒程式 , 4核對他不起效能增進

想請問

如果改用 4C/8T 的 CPU 2.8G

結果會依然是 1.27 倍 , 還是倍數會加大 ??

physx 2011-10-06 11:01 AM

拿i5-2500跟i7-2600來說 只差在i7時脈多0.1GHz

同架構下有差只會差在"時脈"跟"緩存大小"這兩項

所以同時脈同緩存下i5/i7單執行緒效能是完全相同的

不知道這樣的說法對您是否有幫助 :)

vxr 2011-10-06 11:08 AM

引用:
作者quickcccc
4C/8T 和 4C/4T 對單執行緒程式有差嗎

以 E2200 2.2G 和 Q9500 2.8G 為例

用一支單執行緒程式去試 Q9500 比 E2200 快多少 ?

快 1.27 倍

而 1.27 剛好就是 2.8G / 2.2G 的相除值

換句話說這支 支單執行緒程式 , 4核對他不起效能增進

想請問

如果改用 4C/8T 的 CPU 2.8G

結果會依然是 1.27 倍 , 還是倍數會加大 ??

依照現行主流OS的執行緒管理..
以Windows為主..
或著依靠執行環境的管理而定(例如.NET的CLR環境..)..
再依照現行主流的計算機架構(x86)...
100%不會因為這個CPU是Multi-threading而性能增長...
除非你把這個觀點擴展到以process為層級來看...

否則決定在App的情況下...
如果不是寫Mutli-threading做某種程度的非同步操作...
那Single-thread依據可能存在的資源管理環境..
在依照OS..
怎麼樣都只會有一個thread跑...

OZHHC 2011-10-06 12:18 PM

單執行緒應該只有推土機架構才會有幫助吧(重點是單核效能要先提昇上來...)

dmwc 2011-10-06 12:27 PM

引用:
作者OZHHC
單執行緒應該只有推土機架構才會有幫助吧(重點是單核效能要先提昇上來...)

我很懷疑有啥幫助,現在也沒有產品可以證明有幫助

單執行緒程式有時候並不是 CPU 運算能力不夠,而是卡在某些資源上,這時就只能靠暴力法提升處理器單核心運算能力提升效能,其他啥花俏的方法都是九牛一毛

OZHHC 2011-10-06 01:21 PM

引用:
作者dmwc
我很懷疑有啥幫助,現在也沒有產品可以證明有幫助

單執行緒程式有時候並不是 CPU 運算能力不夠,而是卡在某些資源上,這時就只能靠暴力法提升處理器單核心運算能力提升效能,其他啥花俏的方法都是九牛一毛

推土機的架構是去改善OS無法把單執行緒有效的分配給多CPU核心的限制。

「理論上」對單一大執行緒是會有改善的,但如果OS處理的好,或執行緒不夠大,甚至每個核心效能差,或是分配處理器效能太差都會導致overhead增加,更進一步拉低效能...。

dox6 2011-10-06 01:23 PM

引用:
作者quickcccc
4C/8T 和 4C/4T 對單執行緒程式有差嗎

以 E2200 2.2G 和 Q9500 2.8G 為例

用一支單執行緒程式去試 Q9500 比 E2200 快多少 ?

快 1.27 倍

而 1.27 剛好就是 2.8G / 2.2G 的相除值

換句話說這支 支單執行緒程式 , 4核對他不起效能增進

想請問

如果改用 4C/8T 的 CPU 2.8G

結果會依然是 1.27 倍 , 還是倍數會加大 ??


如果環境很pure,系統load很低
應該會比 1.27略小

dox6 2011-10-06 01:34 PM

引用:
作者physx
拿i5-2500跟i7-2600來說 只差在i7時脈多0.1GHz

同架構下有差只會差在"時脈"跟"緩存大小"這兩項

所以同時脈同緩存下i5/i7單執行緒效能是完全相同的

不知道這樣的說法對您是否有幫助 :)


照理說不可能完全相同,HT仲裁不論做得再好一定會miss,HT本身也要吃掉一些cycle
單看其中一個核心,永遠都只塞入一個thread,打開ht一定會比關閉ht要慢
只是ht做的好會讓這個差異縮小。但是當核心可以被塞入兩個thread時
有ht的核心就有機會在效率上大幅超過沒有的核心,雖然機率只有20-30%
你可以把ht當成賭博,賭錯了輸2-3元,但賭贏了可以贏20-30元

quickcccc 2011-10-06 03:22 PM

謝謝
看來還是只能提高時脈才能解決

quickcccc 2011-10-06 03:27 PM

引用:
作者OZHHC
推土機的架構是去改善OS無法把單執行緒有效的分配給多CPU核心的限制。

「理論上」對單一大執行緒是會有改善的,但如果OS處理的好,或執行緒不夠大,甚至每個核心效能差,或是分配處理器效能太差都會導致overhead增加,更進一步拉低效能...。


下期會注意推土機的表現


所有的時間均為GMT +8。 現在的時間是01:35 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。