※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

時間
最新2023-06-10 11:27:00
留言46則留言,17人參與討論
推噓12 ( 12034 )
※ 引述《luvstarrysky ()》之銘言: : 心得:黏膠水的架構似乎生出了快取延遲的問題,這點在Ryzen CPU靠堆疊3D快取的方式 : 來解決,但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的,畢竟現在都 : 只能靠吃NV吃剩的大餅碎屑來充飢,不需要搞得多好也有粉絲買單,財報好看, : AMD笑哈哈,消費者苦哈哈。 這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧 先講L3的latency並不是很重要,GPU的設計本來就是吃bandwidth犧牲latency。 L3在chiplet,latency增加並不是大問題,大問題是data從mcd到gcd需要很大的能耗,所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上,N/I擴張L2棄L3是有原因的。 https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/ 這篇其實主要是講VOPD(dual issues)的問題,rdna3在wave32本來就不容易dual issues,舊的wave64模式反而容易dual issues,這是compiler的問題。 rx7600還有另一個大問題,因為用6n而不是5n空間不夠,犧牲掉vector registers,這造成dual issues更困難,因為vector registers的不足。 本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能,但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。 https://i.imgur.com/wsGh4b3.png
Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?
可以看到,如果能夠dual issues,rx7600幾乎可以追上rx6900xt。 這篇其實蠻有趣的,如果你想粗淺了解rdna3的架構與問題。 ------------------------------------- 如果你想黑A,找一下geohot最近兩天的言論,真是把AMD黑死了,雖然geohot自己的問題也很大,但他黑之有物 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1686182036.A.AC3.html

Re: 回文串

1246
> Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?
PC_Shopping06/08 07:53

46 則留言

※ 編輯: oopFoo (219.70.128.119 臺灣), 06/08/2023 07:55:59

qwe753951, 1F
rdna3真的是大大大失敗114.44.208.132

E6300, 2F
所以蘇媽該降價了223.138.67.29

wardraw, 3F
黑A真的要言之有物 相比前篇心得跟坨一樣124.11.129.176

Ekmund, 4F
the tiny corp 才沒多久 他又轉向了..XD223.137.220.161

Tsukasayeo, 5F
他只是想黑,才不管內容怎樣59.120.196.118

SHR4587, 6F
MCM第一代問題多,等下一代220.136.27.203

ideo, 7F
這篇程度和原PO天差地遠39.9.233.5

friedpig, 8F
MCD能耗是都花在傳輸上嗎? 這代都2.5D118.163.149.125

friedpig, 9F
了 感覺是L3太大本來就吃電 應該不是118.163.149.125

friedpig, 10F
傳輸的問題118.163.149.125

friedpig, 11F
AMD架構本來就贏不過NV也是問題 天生就118.163.149.125

friedpig, 12F
吃電了 MCM的確還有在傷一點 最後就QQ118.163.149.125

smallreader, 13F
架構還好,看了geohot黑的點應該驅動223.138.107.67

ltytw, 14F
只不過最近我們也是在嘲諷nv功耗換效能?223.141.250.53

oopFoo, 15F
L3的頻寬用mcm,耗電量大增,SPR也有同樣219.70.128.119

oopFoo, 16F
問題。驅動就是硬體的延伸,好硬體好驅動219.70.128.119

BlackCoal, 17F
先推再說,雖然我真的看不懂110.30.24.228

friedpig, 18F
傳輸耗能沒那麼多拉 功耗差的量級不是118.163.149.125

friedpig, 19F
傳輸的問題118.163.149.125

friedpig, 20F
2.5D的傳輸功耗應該是1pJ/bit以內118.163.149.125

friedpig, 21F
inifite fanout link峰值頻寬是5.3TB/s118.163.149.125

friedpig, 22F
全頻寬吃下去40~50W吧 不過怎麼可能沒事118.163.149.125

friedpig, 23F
一直保持那麼大的數據交換 多少有影響但118.163.149.125

friedpig, 24F
應該不是主因118.163.149.125

friedpig, 25F

friedpig, 26F
這邊提到CoWoS 0.5pJ/bit而已 InFO到底118.163.149.125

friedpig, 27F
多少還要查一下118.163.149.125

friedpig, 28F
https://tinyurl.com/4v2snb2x InFO參考118.163.149.125

friedpig, 29F
這邊 可能才0.2~0.3pJ/Bit而已 傳輸功耗118.163.149.125

friedpig, 30F
有可能才20W不到 問題不該是這個118.163.149.125

dildoe, 31F
比較好奇高速io在不傳輸時是不是很省電?XD93.91.80.6

leung3740250, 32F
spr的問題不在於emib,而是電壓過103.77.192.10

leung3740250, 33F
高加上全吞吐avx512和amx103.77.192.10

leung3740250, 34F
CML-S之後的任何一代電壓都是比正103.77.192.10

leung3740250, 35F
常需求多出0.1v起跳,SPR都快比電103.77.192.10

leung3740250, 36F
壓表標的多了0.15v了103.77.192.10

aegis43210, 37F
server就是穩定性和安全性最重要,SPR106.104.74.67

aegis43210, 38F
已經延遲了一年,為了盡快出貨,電壓106.104.74.67

aegis43210, 39F
也只能設定的高一些106.104.74.67

aegis43210, 40F
EMR會改善的106.104.74.67

oopFoo, 41F
高頻高效能的die2die功耗那有辦法這麼低36.224.253.35

oopFoo, 42F
只跑低頻什麼低功率都有可能。spr的問題真36.224.253.35

oopFoo, 43F
在emib。高功耗i皇還可以解決,emib的效率36.224.253.35

oopFoo, 44F
還需要時間36.224.253.35

phoenixcx, 45F
講太深…112.78.65.80

kenuser, 46F
你太認真了,但是有料給推210.242.157.243

oopFoo 作者的近期文章

Re: [情報] 英特爾認錯…擴大釋單台積 操刀範圍擴及
※ 引述《AquaChen1012 (阿扁)》之銘言: : 英特爾執行長基辛格在法人會議中表示,英特爾晶片代工業務受到決策錯誤的拖累,包括 : 一年前反對使用荷蘭ASML的EUV設備。基辛格說,部分由於這些失誤,英特爾已將晶圓總 : 數的約
Re: [閒聊] 現在橫空出世的NPU
NPU還是很有用的,以後應用會越來越多。 我舉個遊戲應用的例子。 現在遊戲對話都是固定死的。但用現代ai可以活潑很多。我大概解釋一下技術流程。 玩家用語音跟遊戲角色對話。 用Whisper轉換語音到文字。 用bert/gpt來分析文字的情緒
Re: [閒聊] 現在橫空出世的NPU
※ 引述《wahaha99 (我討厭人類)》之銘言: : 以這個評測為例, 讓我有點霧裡看花, 不是很能明白: : Intel Ultra 7 155H : CPU分數 67 : GPU分數 413 : NPU分數 282 : 嗯....這
更多 oopFoo 作者的文章...