PCDVD數位科技討論區 - PTT[情報] RTX 3080 各種跑分偷跑八卦

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)

- - PTT[情報] RTX 3080 各種跑分偷跑八卦 (https://www.pcdvd.com.tw/showthread.php?t=1178130)

PTT[情報] RTX 3080 各種跑分偷跑八卦

現在看來 3080 的實際總體效能約為 2080TI的1.35~1.4倍
3070甚至只是跟2080TI互有勝負
增長幅度不算太高 ,
精簡過的CUDA 數量多一些
但實際1:1的CUDA反而可能會輸
這代的最大優點在於大降價
以3070,2080TI雙方都新品來說
一半不到的價格下可取得2080TI的效能

PTT[情報] RTX 3080 各種跑分偷跑八卦

RTX 3080首個DX12遊戲成績曝光：默頻僅比2080 Ti快27%
https://news.mydrivers.com/1/712/712050.htm

有爆料人提前偷跑了RTX 3080在《奇點灰燼（Ashes of the Singularity）》中的基準測試成績。

在Crazy_4K設定下，這套i9-9900K+RTX 3080的平台綜合拿到8700分，其中綜合負載下的幀率是88.3FPS。

據稱成績是默頻跑出，而同樣默頻下的RTX 2080 Ti成績是69.9FPS，RTX 2070是46.9FPS，RX 5700 XT是45.5FPS。

換言之，僅就《奇點灰燼》的DX12來看，RTX 3080比RTX 2080 Ti快27%。

---

其實RTX 3080的實體CUDA數量跟2080 Ti一樣

不動用光追跟DLSS的情況下，單靠新架構+8nm能增長約30%已經不錯了

這次NV宣傳的性能都是建立在開光追+DLSS 2.0的最大化性能

畢竟RT核心跟Tensor核心也都大幅強化

老黃說法是加倍、加倍再加倍，三個加倍造就30系列強大性能

讓我熊熊想起功夫熊貓1，浣熊師傅巡視監獄時也是說加倍防禦、加倍人力、加倍任何東西 :laugh:

Ashes of the Singularity這個遊戲不是測GPU性能的好題材啊

因為它是即時戰略, 在GPU很強的情況下沒有達100%運作狀態, 分數偏低

能比較出差異的, 應該是4K底下GPU利用率很高的遊戲, 都跑在100%狀態下

其實這代"實體"Cuda核心數跟上代都差不多

RTX 3060 外傳是實體核心 2176 = 2060 Super

RTX 3070 2944x2 = 5888
RTX 3080 4352x2 = 8704
RTX 3090 5248x2= 10476

看老外那邊有資深的網友分析落落長
結論是這代安培架構引入了類似超線程的技術
以 RTX 3090來說, 實體Cuda核心5248, 超線程後等效核心是10476

但是有在玩CPU的同學都知道
8C/8T 升級成 8C/16T 後就算場景應用下都滿載100%
也很難達到多100% 的效能, 可能也就是多35-40% 左右而已!

比方說開板的
RTX 3070 (2944C/5888T) vs RTX 2080Ti 4352C
各有勝負也是很正常的

所以RTX 3000系說不定成本跟上代沒差太多...

引用:

作者SouthPark7788

結論是這代安培架構引入了類似超線程的技術

這個有趣
那3060跟3050假如也有超線程技術應該馬上跟上一代的差距就拉出來

新一代70能跟上代80Ti互有勝負，我覺得這就不錯了
當初買1070也是不知不覺就4年過去了…至今很多遊戲也能跑得還算不錯

安培像前代一樣保留了64個FP32單元，但是新的64個單元現在指定為 " FP32 和 INT32"

一半的單元專用於浮點運算，而另一半則可以執行浮點運算或整數運算，總浮點運算量是沒錯的。

新遊戲的GPU利用佔比FP32浮點和INT32整數為4:1，所以這種設計視遊戲所需可以彈性調整，

不會浪費太多電晶體在遊戲用不到的地方。

我看到的講法是說,以前要兩個週期才能執行一次運算,安培架構只要一個週期就可以執行一次運算,等於是效率加倍.還有就是三星的價格比台積積便宜,大約只要六成左右.

引用:

作者aya0091

RTX 3080首個DX12遊戲成績曝光：默頻僅比2080 Ti快27%...

跟DE的結果...差距好像有點大 :ase

引用:

作者SouthPark7788

其實這代"實體"Cuda核心數跟上代都差不多
結論是這代安培架構引入了類似超線程的技術...

以目前的消息來看
不太算是超線程，畢竟超線程就是在沒有增加內核架構的情況下，增加管線利用率
硬要說的話，NV這次比較像是AMD推土機架構一核雙模
AMD推土機是一個模組=一個浮點配兩個整數
NV這次比較像是反過來
NVIDIA Ampere 一個SM子核心裡面是一組 16個INT32+16個FP32另外再加上一組16個FP32

https://www.nvidia.com/en-us/geforc...s-community-qa/

https://wccftech.com/nvidia-details...s-cards-reddit/
" One of the key design goals for the Ampere 30-series SM was to achieve twice the throughput for FP32 operations compared to the Turing SM. To accomplish this goal, the Ampere SM includes new datapath designs for FP32 and INT32 operations. One datapath in each partition consists of 16 FP32 CUDA Cores capable of executing 16 FP32 operations per clock. Another datapath consists of both 16 FP32 CUDA Cores and 16 INT32 Cores. As a result of this new design, each Ampere SM partition is capable of executing either 32 FP32 operations per clock, or 16 FP32 and 16 INT32 operations per clock. All four SM partitions combined can execute 128 FP32 operations per clock, which is double the FP32 rate of the Turing SM, or 64 FP32 and 64 INT32 operations per clock."