※ 本文轉寄自 ptt.cc, 文章原始頁面

看板PC_Shopping

作者oopFoo (3d)

標題

Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

時間2023-06-08 15:53:52

最新2023-06-10 11:27:00

留言46則留言，17人參與討論

推噓12 ( 12推0噓34→ )

回文2則回文

※ 引述《luvstarrysky ()》之銘言： : 心得：黏膠水的架構似乎生出了快取延遲的問題，這點在Ryzen CPU靠堆疊3D快取的方式 : 來解決，但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的，畢竟現在都 : 只能靠吃NV吃剩的大餅碎屑來充飢，不需要搞得多好也有粉絲買單，財報好看， : AMD笑哈哈，消費者苦哈哈。這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧先講L3的latency並不是很重要，GPU的設計本來就是吃bandwidth犧牲latency。 L3在chiplet，latency增加並不是大問題，大問題是data從mcd到gcd需要很大的能耗，所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上，N/I擴張L2棄L3是有原因的。 https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/ 這篇其實主要是講VOPD(dual issues)的問題，rdna3在wave32本來就不容易dual issues，舊的wave64模式反而容易dual issues，這是compiler的問題。 rx7600還有另一個大問題，因為用6n而不是5n空間不夠，犧牲掉vector registers，這造成dual issues更困難，因為vector registers的不足。本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能，但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。 https://i.imgur.com/wsGh4b3.png

Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

可以看到，如果能夠dual issues，rx7600幾乎可以追上rx6900xt。這篇其實蠻有趣的，如果你想粗淺了解rdna3的架構與問題。 ------------------------------------- 如果你想黑A，找一下geohot最近兩天的言論，真是把AMD黑死了，雖然geohot自己的問題也很大，但他黑之有物 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1686182036.A.AC3.html

Re: 回文串

-4798

[情報] 7900XTX 的L3快取竟然比7600還慢58%!?

PC_Shopping06/07 23:23

1246

> Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

PC_Shopping06/08 07:53

46 則留言

※ 編輯: oopFoo (219.70.128.119 臺灣), 06/08/2023 07:55:59

推

qwe75395106/08 07:58, 1F

rdna3真的是大大大失敗114.44.208.132

推

E630006/08 08:53, 2F

所以蘇媽該降價了223.138.67.29

推

wardraw06/08 09:09, 3F

黑A真的要言之有物相比前篇心得跟坨一樣124.11.129.176

→

Ekmund06/08 09:35, 4F

the tiny corp 才沒多久他又轉向了..XD223.137.220.161

推

Tsukasayeo06/08 09:56, 5F

他只是想黑，才不管內容怎樣59.120.196.118

推

SHR458706/08 10:15, 6F

MCM第一代問題多，等下一代220.136.27.203

推

ideo06/08 10:24, 7F

這篇程度和原PO天差地遠39.9.233.5

→

friedpig06/08 11:42, 8F

MCD能耗是都花在傳輸上嗎？這代都2.5D118.163.149.125

→

friedpig06/08 11:43, 9F

了感覺是L3太大本來就吃電應該不是118.163.149.125

→

friedpig06/08 11:43, 10F

傳輸的問題118.163.149.125

→

friedpig06/08 11:46, 11F

AMD架構本來就贏不過NV也是問題天生就118.163.149.125

→

friedpig06/08 11:47, 12F

吃電了 MCM的確還有在傷一點最後就QQ118.163.149.125

推

smallreader06/08 11:49, 13F

架構還好，看了geohot黑的點應該驅動223.138.107.67

推

ltytw06/08 11:57, 14F

只不過最近我們也是在嘲諷nv功耗換效能?223.141.250.53

→

oopFoo06/08 12:33, 15F

L3的頻寬用mcm，耗電量大增，SPR也有同樣219.70.128.119

→

oopFoo06/08 12:33, 16F

問題。驅動就是硬體的延伸，好硬體好驅動219.70.128.119

推

BlackCoal06/08 12:34, 17F

先推再說，雖然我真的看不懂110.30.24.228

→

friedpig06/08 12:37, 18F

傳輸耗能沒那麼多拉功耗差的量級不是118.163.149.125

→

friedpig06/08 12:37, 19F

傳輸的問題118.163.149.125

→

friedpig06/08 12:45, 20F

2.5D的傳輸功耗應該是1pJ/bit以內118.163.149.125

→

friedpig06/08 12:46, 21F

inifite fanout link峰值頻寬是5.3TB/s118.163.149.125

→

friedpig06/08 12:47, 22F

全頻寬吃下去40~50W吧不過怎麼可能沒事118.163.149.125

→

friedpig06/08 12:47, 23F

一直保持那麼大的數據交換多少有影響但118.163.149.125

→

friedpig06/08 12:47, 24F

應該不是主因118.163.149.125

→

friedpig06/08 12:52, 25F

https://tinyurl.com/23pjrefr118.163.149.125

→

friedpig06/08 12:52, 26F

這邊提到CoWoS 0.5pJ/bit而已 InFO到底118.163.149.125

→

friedpig06/08 12:55, 27F

多少還要查一下118.163.149.125

→

friedpig06/08 13:00, 28F

https://tinyurl.com/4v2snb2x InFO參考118.163.149.125

→

friedpig06/08 13:00, 29F

這邊可能才0.2~0.3pJ/Bit而已傳輸功耗118.163.149.125

→

friedpig06/08 13:00, 30F

有可能才20W不到問題不該是這個118.163.149.125

→

dildoe06/08 13:54, 31F

比較好奇高速io在不傳輸時是不是很省電?XD93.91.80.6

→

leung374025006/08 14:24, 32F

spr的問題不在於emib，而是電壓過103.77.192.10

→

leung374025006/08 14:24, 33F

高加上全吞吐avx512和amx103.77.192.10

→

leung374025006/08 14:25, 34F

CML-S之後的任何一代電壓都是比正103.77.192.10

→

leung374025006/08 14:25, 35F

常需求多出0.1v起跳，SPR都快比電103.77.192.10

→

leung374025006/08 14:25, 36F

壓表標的多了0.15v了103.77.192.10

推

aegis4321006/08 16:17, 37F

server就是穩定性和安全性最重要，SPR106.104.74.67

→

aegis4321006/08 16:17, 38F

已經延遲了一年，為了盡快出貨，電壓106.104.74.67

→

aegis4321006/08 16:17, 39F

也只能設定的高一些106.104.74.67

→

aegis4321006/08 16:19, 40F

EMR會改善的106.104.74.67

→

oopFoo06/08 17:25, 41F

高頻高效能的die2die功耗那有辦法這麼低36.224.253.35

→

oopFoo06/08 17:26, 42F

只跑低頻什麼低功率都有可能。spr的問題真36.224.253.35

→

oopFoo06/08 17:27, 43F

在emib。高功耗i皇還可以解決，emib的效率36.224.253.35

→

oopFoo06/08 17:27, 44F

還需要時間36.224.253.35

推

phoenixcx06/08 19:47, 45F

講太深…112.78.65.80

推

kenuser06/10 11:27, 46F

你太認真了，但是有料給推210.242.157.243

oopFoo 作者的近期文章

Re: [情報] 英特爾認錯…擴大釋單台積操刀範圍擴及

※ 引述《AquaChen1012 (阿扁)》之銘言： : 英特爾執行長基辛格在法人會議中表示，英特爾晶片代工業務受到決策錯誤的拖累，包括 : 一年前反對使用荷蘭ASML的EUV設備。基辛格說，部分由於這些失誤，英特爾已將晶圓總 : 數的約

Re: [情報] Intel 的 15700K 15900K 消息曝光

Re: [情報] Intel 的 15700K 15900K 消息曝光

[情報] MSI 6800/6800XT 特價$12990

[情報] MSI 6800/6800XT 特價$12990

Re: [情報] Intel下放APO至12/13代CPU舊代K系列CPU

Re: [情報] Intel下放APO至12/13代CPU舊代K系列CPU

[情報] MSI Claw A1M 掌機

[情報] MSI Claw A1M 掌機

[閒聊] Steam Deck的Van Gogh APU有個隱藏的NPU

[閒聊] Steam Deck的Van Gogh APU有個隱藏的NPU

Re: [閒聊] 現在橫空出世的NPU

NPU還是很有用的，以後應用會越來越多。我舉個遊戲應用的例子。現在遊戲對話都是固定死的。但用現代ai可以活潑很多。我大概解釋一下技術流程。玩家用語音跟遊戲角色對話。用Whisper轉換語音到文字。用bert/gpt來分析文字的情緒

Re: [閒聊] 現在橫空出世的NPU

※ 引述《wahaha99 (我討厭人類)》之銘言： : 以這個評測為例, 讓我有點霧裡看花, 不是很能明白: : Intel Ultra 7 155H : CPU分數 67 : GPU分數 413 : NPU分數 282 : 嗯....這

Re: [情報] Intel Lunar Lake消息

Re: [情報] Intel Lunar Lake消息

[情報]MTL桌機會在2024發行

[情報]MTL桌機會在2024發行

更多 oopFoo 作者的文章...

PC_Shopping 板最新熱門文章

[菜單] 82k 4K遊戲白色機

已買/未買/已付訂金（元）：未買預算/用途：之前沒組過白機感謝Z大的置底貼文讓我看了手癢想配一台看看目前只會自己就已裝好的主機單換記憶體顯卡等等不敢試超頻因此主機應該會讓店家直接裝好預計主機會放在電視櫃接4K電視主要用途

[請益] 關於記憶體選擇時脈與時序

環境 i7-13700K 技嘉Z790-D4 金士頓 32G*2 1.3200 C16 跟 2.3600 C18 這兩個應該怎麼選？是選 1然後超到3600比較好嗎？不過我很久沒超頻了只會開XMP 哈哈哈本來是持有4隻16G的 36

[菜單] 25-30K 遊戲機

預算/用途：25-30K / 遊戲機：LOL,OW,PUBG,APEX等，希望未來三到五年不用再升級已經有估了兩張單，想請各位幫忙看一下另外有包含TYPE-C插孔的機殼也想請各位推薦，感謝大家 1. CPU (中央處理器)：Intel

[菜單] 想組一台Linux實體機做研究

已買/未買/已付訂金（元）：預算/用途：主要是想研究 1. 數據高速傳輸的架構(Ex:DPDK,PF_RING...等) 2. 容器&微服務的架設以及使用 3. 用看看AMD的ROCm ,自己建立模型玩看看雖然已有一台還不錯的

[菜單] 想組一台45K左右的遊戲主機

已買/未買/已付訂金（元）：已買部份預算/用途：20K 目前想組一台以可以順打APEX、MH等作品的主機。 CPU (中央處理器)：i5 12600K MB (主機板)：ROG Z790-A GAMING WIFI D4 RAM (記憶體

[請益] POWER選擇 750W或850W, 海韻或振華

現有配備: CPU: E5-2683 v3 TDP 應該是120W VGA: 不知名 1050Ti 4GB 75W~100W的耗電 HDD: 3.5 x 4, 2.5 ssd x 2 , nvme x 1 RAM: 8條 ddr4 現在的P

[請益] 換2K螢幕的優缺點

我一直以來都是用1080P雙螢幕主螢幕144Hz 副螢幕60Hz 都是27吋未來也打算用27吋桌深大約80cm 有用螢幕支架平常用途就是玩遊戲跟看yt配飯前陣子太無聊買了4080s 發現好像能推得動高一點的解析度而且發現現在2K

[菜單] 影音處理兼遊戲機

已買/未買/已付訂金（元）：預算/用途：版上大大好，小弟叛逃至Mac使用了近10多年，最近因為許多因素，想要再組一台PC，因為脫離PC超久，相關知識已呈現脫節狀態，有任何建議歡麻煩大大們指點，請大大鞭小力一點本機有三個用途：

[閒聊] 7500F的溫度？

各位晚安之前組電腦的時候聽推文說這顆CPU很涼只要用單塔散就夠了目前新電腦用了兩個禮拜 AIDA64偵測軟體測出平常待機狀態 CPU溫度是55度上下比我哥的7800x3d 40幾度還高請問這是正常的嗎？好像待機要40度才理想是