※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

Re: [情報] RX 6000系列規格

時間
最新2020-10-29 19:32:00
留言45則留言,14人參與討論
推噓8 ( 8037 )
※ 引述《KotoriCute (Lovelive!)》之銘言: : 6900 XT 6800 XT 6800 5700 XT : Stream Processors 80CU 72CUs 60CUs 40 CU : Game Clock 2015MHz 2015MHz 1815MHz 1755MHz : Boost Clock 2250MHz 2250MHz 2105MHz 1905MHz : Throughput (FP32) 20.6 TFLOPs 18.6 TFLOPs 13.9 TFLOPs 9.75 TFLOP : Memory Clock 16 Gbps(?) G6 16 Gbps(?) G6 14 Gbps(?) G6 14 Gbps G6 : Memory Bus Width 256-bit 256-bit 256-bit 256-bit : VRAM 16GB 16GB 16GB 8GB : Infinity Cache 128MB 128MB 128MB N/A : Total Board Power 300W 300W 250W 225W : 製程 TSMC 7nm TSMC 7nm TSMC 7nm TSMC 7nm : Transistor Count 26.8B 26.8B 26.8B 10.3B : Architecture RDNA2 RDNA2 RDNA2 RDNA (1) : GPU Navi 21 Navi 21 Navi 21 Navi 10 : Launch Date 12/08/2020 11/18/2020 11/18/2020 07/07/2019 : Launch Price $999 $649 $579 $399 有點好奇規格寫的算力比30系列低很多,遊戲FPS卻比較高,是受益於Infinity Cache機制還是NV的GPU處於低負載? ----- Sent from JPTT on my iPhone -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.24.124 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1603931069.A.D86.html

45 則留言

arrenwu, 1F
卡都還沒出來 妳怎麼得到這結論的?
是根據這篇FP32的算力和NV給的算力

nicholas0406, 2F
等實測比較穩 有逼到NVIDIA RTX30系列降價 就賺了

nicholas0406, 3F
消費者賺
※ 編輯: yangwen5301 (223.140.24.124 臺灣), 10/29/2020 08:31:28

click2258, 4F
如果沒降呢

AreLies, 5F
不同架構預估的TFLOPs不一樣

AreLies, 6F
不過礙於架構並不一定能表現在遊戲上

zsp40773, 7F
不期不待 不受傷害

arrenwu, 8F
但遊戲FPS還沒出來呀
AMD發表會不就有說遊戲表現的部分了

AreLies, 9F
之前AMD還沒砍單精度跟雙精度的時候TFLOPs也是比NV

AreLies, 10F
高 實際玩遊戲還是打不贏NV
原來如此

dieorrun, 11F
浮點數看看就算了 不同架構幾乎沒啥可比性

dieorrun, 12F
浮點數看看就算了 不同架構幾乎沒啥可比性
那順便再問一下NV的光追是獨立硬體,理論上開光追應該不會影響到原本算shader的效能吧? ~
※ 編輯: yangwen5301 (223.140.24.124 臺灣), 10/29/2020 08:43:30

arrenwu, 13F
那是AMD講的 不是實測的結果XDDDD

arrenwu, 14F
只有第三方測試結果才是真的 不管AMD Intel NV

AreLies, 15F
前提是RT core規模夠大的話

NoobCV, 16F
會影響到吧 開光追幀數下降要是單純因為光追單元瓶

NoobCV, 17F
頸拖累shader也太蠢

friedpig, 18F
nv這代的架構問題flops不太一樣 實際上大概只有2/3

friedpig, 19F
左右而已
喔?為什麼啊 因為之前做AI相關的效能評估時看TFLOPs還蠻準的,所以才會問這問題

AreLies, 20F
RT只有負責光線追蹤功能在模擬反射等等的功能

kimula01, 21F
每個遊戲設計的方式不同啊 不然你看軒轅劍有多吃
※ 編輯: yangwen5301 (223.140.24.124 臺灣), 10/29/2020 08:59:33

guiltyboa, 22F
還是等NDA最準了

friedpig, 23F
老黃這代運算直接多做一倍32/int互換的運算單元上去

friedpig, 24F
後端沒跟著放大 所以算起來跟以前的不太一樣

azumanga, 25F
等實測最準

kqalea, 26F
TF32 跟FP32 是不一樣低wwww

kqalea, 27F
FP32 A100=19.5TFlops 6900=23TFlops

kuma660224, 28F
AI效能看Tflops也只有同架構才準

friedpig, 29F
不是 你別看A100阿 架構跟A102差很多

kuma660224, 30F
GPU的Tflops都是FMADD乘積運算值

friedpig, 31F
A102才有FP32 Double的設計 所以是35.58TFlops

kuma660224, 32F
就只是個參考 不代表其他指令速度

kuma660224, 33F
快取與頻寬也明顯影響實際運用

kuma660224, 34F
基本上除了矩陣運算 沒什麼應用是

kuma660224, 35F
一直在跑FMADD

kuma660224, 36F
處理頂點轉換是超常用乘積運算

kuma660224, 37F
但現在繪圖著色瓶頸通常不是頂點轉換

kuma660224, 38F
其他指令的效率甚至固定管線配置更重要

kuma660224, 39F
只是那些不像Tflops這麼容易數據分析

kqalea, 40F
friedpig 是對滴

kuma660224, 41F
GA100純走專業用途 特化一堆

kuma660224, 42F
int4/int8/Fp64等AI或超算的精度

kuma660224, 43F
基本上不適合遊戲用

Jerrylin1212, 44F
amd遊戲效能再等等看實卡評測吧,昨天那張比較表很

Jerrylin1212, 45F
簡陋