※ 本文轉寄自 ptt.cc, 文章原始頁面

看板PC_Shopping

作者oopFoo (3d)

標題

Re: [閒聊] M2Ultra在AI比intel+nVIDIA有架構優勢?

時間2023-07-03 18:27:59

最新2023-07-05 21:00:00

留言52則留言，12人參與討論

推噓2 ( 7推5噓40→ )

回文2則回文

※ 引述《hugh509 ((0_ 0))》之銘言： : 先說我不懂AI運算 : 只是看了林亦的新影片 : https://youtu.be/UsfmqTb2NVY

就鬼扯，我也懶的噴他。現在老黃是遙遙領先所有人，AI全吃，沒什麼好爭辯的。現在所謂的DL，第一需要的是運算，第二才是記憶體頻寬。 M2Ultra的gpu就27.2tflops(fp32)，跟3080差不多，但ampere有兩倍的(fp16+fp32accumulate)還有4x的(fp16)。現在fp16訓練就很夠了，擔心你可以用fp16+fp32模式，那也是2x你m2 ultra。 https://images.nvidia.com/aem-dam/Solutions/Data-Center/l4/nvidia-ada-gpu-architecture-whitepaper-v2.1.pdf https://tinyurl.com/yuak5w5d 4090是82.6tflops(fp32)，330.3tflops(fp16)。m2ultra連車尾都看不到，可憐啊。然後M2Ultra的31.6tops，那應該是int8無誤如果是int4那就更可憐。4090是660.6(int8)tops與1321.2(int4)tops。這已經是被超車好幾十圈了。(tops是inference用的) H100 datasheet https://resources.nvidia.com/en-us-tensor-core/nvidia-tensor-core-gpu-datasheet https://tinyurl.com/bdfuutbe h100 pcie是最低階的 756tflops(tf32) 1513tflop(fp16) h100是狠狠的虐了所有人包含a100。2x~4x(a100) https://www.mosaicml.com/blog/amd-mi250 AMD的mi250不到a100的80%，mi300的specs其實跟mi250差不多，mi300主要是apu功能。只有google的tpu跟intel的gaudi2跟a100有輸有贏。 https://mlcommons.org/en/training-normal-30/ gaudi2在gpt3的訓練大概是h100的1/3性能。 intel為什麼要取消rialto bridge？現在ai當道，fp64強的hpc架構根本毫無用處。AMD因為只有mi300所以只能硬上了，但383tflops(fp16)要怎麼跟1500+tflops的h100比？ intel現在把資源集中在gaudi3/4，期望2年內可以看到老黃的車尾。有人以為老黃只是因為cuda軟體贏。其實nn很容易移植到其它架構，老黃是硬體大贏＋長期耕耘ai。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.249.214 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1688351283.A.3EF.html

AINvidia

Re: 回文串

48255

[閒聊] M2Ultra在AI比intel+nVIDIA有架構優勢?

PC_Shopping07/01 17:17

252

> Re: [閒聊] M2Ultra在AI比intel+nVIDIA有架構優勢?

PC_Shopping07/03 10:27

52 則留言

→

WYchuang07/03 10:54, 1F

MI300應該沒有跟250差不多 … apu只是其218.164.221.191

→

WYchuang07/03 10:54, 2F

中一個型號 mi300x才是全部gpu218.164.221.191

噓

a00000000007/03 11:01, 3F

mi300x我記得fp32沒輸h100多少喔76.132.63.174

→

a00000000007/03 11:01, 4F

而且老黃是tensor core76.132.63.174

→

a00000000007/03 11:01, 5F

現在也只有知道多少cu 不知道頻率76.132.63.174

這根本是外行話。
nn本來就是tensor。
有756tflops的tf32幹麼用51tflops的fp32。
h100還有fp8，有些training有用到更是可怕的效率。

→

cor1os07/03 11:08, 6F

樓上射惹125.227.5.157

推

E630007/03 11:50, 7F

反正老黃就是拿遊戲卡來撐場子223.136.188.174

推

harry88690107/03 12:20, 8F

他計算速度主要是開大batch size101.12.29.165

→

harry88690107/03 12:20, 9F

這樣確實不用算力也能有效加速運算效101.12.29.165

→

harry88690107/03 12:20, 10F

率101.12.29.165

夢裡什麼都有。AMD戰未來。

→

CORYCHAN07/03 12:26, 11F

為何您會得出MI300跟MI250差不多的結論223.139.79.158

→

CORYCHAN07/03 12:26, 12F

呢？223.139.79.158

沒有架構大改。現在公開的數據就沒有變動很大。

※ 編輯: oopFoo (36.224.228.156 臺灣), 07/03/2023 12:47:14

推

spfy07/03 13:02, 13F

先不管IA有沒有輸這麼多那影片下面一堆人202.173.43.202

→

spfy07/03 13:03, 14F

贊同蘋果要超越老黃看的我好像走錯世界線202.173.43.202

→

oopFoo07/03 13:26, 15F

現在一堆在講AI的都讓我覺得很莫名奇妙。36.224.228.156

→

oopFoo07/03 13:27, 16F

也有跑ai模型理論很好的人，對硬體完全不36.224.228.156

→

oopFoo07/03 13:28, 17F

懂，也是意見很奇杷。36.224.228.156

推

iuytjhgf07/03 13:35, 18F

你怎麼會期待讀資訊科的人就會組電腦111.252.228.72

→

iuytjhgf07/03 13:36, 19F

寫軟體只在意我的模型到底塞不塞的下去111.252.228.72

噓

a00000000007/03 13:51, 20F

尼484沒看懂我在講啥76.132.63.174

→

a00000000007/03 13:51, 21F

h100 tf32 75676.132.63.174

→

a00000000007/03 13:52, 22F

mi250 38476.132.63.174

→

a00000000007/03 13:52, 23F

mi300x cu數4mi250的1.6倍76.132.63.174

→

a00000000007/03 13:52, 24F

再加上頻率差尼自己算一下76.132.63.174

噓

a00000000007/03 13:54, 25F

等等我好像看錯惹76.132.63.174

噓

a00000000007/03 13:58, 26F

384應該是mi300a的fp16 尷尬76.132.63.174

推

Arbin07/03 14:48, 27F

不過就算目前mi300x有接近h100效能好了111.71.218.44

→

Arbin07/03 14:48, 28F

DL公司應該還是會對他觀望111.71.218.44

→

Arbin07/03 14:49, 29F

主要目前你各位還是太黏NVDA111.71.218.44

推

aegis4321007/03 16:15, 30F

H100強在BF16和自己開發的TF32，這兩175.181.177.110

→

aegis4321007/03 16:15, 31F

種場景都比CDNA3強很多175.181.177.110

→

aegis4321007/03 16:16, 32F

但mi300在int8和int4相對mi250有4倍以175.181.177.110

→

aegis4321007/03 16:16, 33F

上的提升175.181.177.110

→

oopFoo07/03 16:24, 34F

mi300有400tops，假設是int8好了，h100的36.224.228.156

噓

a00000000007/03 16:27, 35F

我看惹一下 mi300在fp16含以下應該76.132.63.174

→

a00000000007/03 16:27, 36F

mi300x大概h100的一半附近76.132.63.174

→

a00000000007/03 16:28, 37F

目前LLM運算應用效率4沒到50%才對76.132.63.174

→

a00000000007/03 16:28, 38F

主要都卡ram76.132.63.174

→

a00000000007/03 16:28, 39F

而且那是a100的狀態76.132.63.174

→

a00000000007/03 16:29, 40F

a100->h100 都是80GB hbm2e->hbm376.132.63.174

→

a00000000007/03 16:30, 41F

tensor core運算效能多很多76.132.63.174

→

a00000000007/03 16:30, 42F

能用到多少就很難說惹76.132.63.174

→

oopFoo07/03 16:32, 43F

寫錯mi250大概400tops。mi300大概1600tops36.224.228.156

→

oopFoo07/03 16:33, 44F

h100是3026tops，350w。mi300要？800w?36.224.228.156

→

oopFoo07/03 16:36, 45F

int8/int4這種inference的東東，xilinx有36.224.228.156

→

oopFoo07/03 16:39, 46F

比較划算的東東。MTL也有30?tops的vpu，這36.224.228.156

→

oopFoo07/03 16:40, 47F

一塊還有空間給IA兩家機會搶。36.224.228.156

推

kqalea07/05 20:57, 48F

m2 ultra 方向是對的啦36.227.221.216

→

kqalea07/05 20:58, 49F

透過LoRA 之類的方法，不需要大量算力36.227.221.216

→

kqalea07/05 20:59, 50F

就可以微調LLM 反而是large memory 可以讓36.227.221.216

→

kqalea07/05 20:59, 51F

大模型輕鬆跑起來微調更重要36.227.221.216

→

kqalea07/05 21:00, 52F

沒有個八張A100 訓練個 LLaMA 都不可能36.227.221.216

oopFoo 作者的近期文章

Re: [情報] 英特爾認錯…擴大釋單台積操刀範圍擴及

※ 引述《AquaChen1012 (阿扁)》之銘言： : 英特爾執行長基辛格在法人會議中表示，英特爾晶片代工業務受到決策錯誤的拖累，包括 : 一年前反對使用荷蘭ASML的EUV設備。基辛格說，部分由於這些失誤，英特爾已將晶圓總 : 數的約

Re: [情報] Intel 的 15700K 15900K 消息曝光

Re: [情報] Intel 的 15700K 15900K 消息曝光

[情報] MSI 6800/6800XT 特價$12990

[情報] MSI 6800/6800XT 特價$12990

Re: [情報] Intel下放APO至12/13代CPU舊代K系列CPU

Re: [情報] Intel下放APO至12/13代CPU舊代K系列CPU

[情報] MSI Claw A1M 掌機

[情報] MSI Claw A1M 掌機

[閒聊] Steam Deck的Van Gogh APU有個隱藏的NPU

[閒聊] Steam Deck的Van Gogh APU有個隱藏的NPU

Re: [閒聊] 現在橫空出世的NPU

NPU還是很有用的，以後應用會越來越多。我舉個遊戲應用的例子。現在遊戲對話都是固定死的。但用現代ai可以活潑很多。我大概解釋一下技術流程。玩家用語音跟遊戲角色對話。用Whisper轉換語音到文字。用bert/gpt來分析文字的情緒

Re: [閒聊] 現在橫空出世的NPU

※ 引述《wahaha99 (我討厭人類)》之銘言： : 以這個評測為例, 讓我有點霧裡看花, 不是很能明白: : Intel Ultra 7 155H : CPU分數 67 : GPU分數 413 : NPU分數 282 : 嗯....這

Re: [情報] Intel Lunar Lake消息

Re: [情報] Intel Lunar Lake消息

[情報]MTL桌機會在2024發行

[情報]MTL桌機會在2024發行

更多 oopFoo 作者的文章...

AI 熱門文章

[問卦] 阿拉伯最新AI機器人發表會偷摸女記者屁股

[新聞] 台積電600元僅是暖身價？謝金河喊多AI

[閒聊] AI畫一家人在包餃子

[新聞] 讓妹子「一秒脫衣爆乳」華為新機AI修圖

[新聞] 張忠謀：AI客戶要求不僅是幾萬片晶圓

[討論] 復興商工抓出第一名使用ai畫圖的學生被

[分享] AI設計30隊雪人

[情報] 履歷製作網站Rezi.ai限時免費

[新聞] 幻獸帕魯被批抄襲寶可夢和使用AI生成

Fw: [閒聊] 逼AI 畫出來的兔子越來越開心

[新聞] AI帶給台灣力量！謝金河點名7匹狼加碼3檔

[新聞] 長得正又便宜！南韓電視台為省錢「改用AI

[情報] 罰單申訴.com（烏龍罰單、AI申訴）發錢

各位好，小弟公司最近發起「罰單申訴」服務不需要任何技巧，3秒內讓AI申訴達人，解決你的烏龍罰單，實現錢包的公平正義。 https://lawplayer.app.link/asZQqf49gIb ◎這個服務主要提供了以下功能：罰單申訴技

Re: [新聞] AI熱潮＋台海局勢降溫傳巴菲特買回

[標的] 技嘉老AI 空

[新聞] 宏達電：王雪紅宣布產品都要搭AI

[情報]復興美工首獎疑使用AI 專家指出10大疑點

[爆卦] 谷歌AI生成影像Gemini因種族歧視下架

Nvidia 熱門文章

[情報] NVIDIA建議13900K/14900K用戶遊戲崩潰請

[新聞] Nvidia 宣布擴大與比亞迪合作、GPU 整合

[問卦] Nvidia已經用AI在預測颱風數發部勒？

[情報] NVIDIA計畫第四季推出RTX5090！採用GDDR7

NVIDIA似乎已經準備就緒，計畫在今年第四季度推出下一代GeForce RTX 5090和RTX 5080 。這一舉措將有助於NVIDIA的板卡合作夥伴擴大出貨量尤其是隨著越來越多的玩家向高端升級，這些GPU的推出還將有助於提高GPU

[情報] AMD認為自家顯卡驅動功能比NVIDIA更具優

AMD認為自家顯卡驅動功能比NVIDIA更具優勢能造成競爭都是好事 2024-01-12 By Lucky AMD 預計將會在 1 月 24 日推出名為「AMD Fluid Motion Frames」（AFMF）的新功能，可直接透過更新

[新聞] Nvidia執行長黃仁勳去年大加薪60%至11億

原文標題： Nvidia執行長黃仁勳去年大加薪60%至11億是英特爾CEO的兩倍多原文連結： https://udn.com/news/story/6811/7964801?from=udn-ch1_breaknews-1-0-news

[討論] Nvidia 資深員工呈「半退休」狀態

https://technews.tw/2023/12/15/senior-staff-half-retire-in-nvidia/ 作者黃嬿 | 發布日期 2023 年 12 月 15 日 12:13 | 分類人力資源 , 職場過

Nvidia市值會不會衝上3兆美元？股價再漲78%就能

原文標題：Nvidia市值會不會衝上3兆美元？股價再漲78%就能辦到原文連結：https://reurl.cc/bDy32r 發布時間：2024-02-22 09:41 記者署名：經濟日報／編譯葉亭均／綜合外電原文內容：「AI第一

[新聞] Nvidia發聲明：台灣地震預料不會影響輝達

PC_Shopping 板最新熱門文章

[菜單] 65K+螢幕遊戲機

未買預算/用途： 65K +螢幕遊戲機 CPU (中央處理器)：【重磅價】AMD【8核】Ryzen7 7800X3D+華碩 TUF GAMING B650M-PLUS WIFI+Acer Predator Pallas II DDR5-6

[菜單] 35K 模擬器 2K遊戲機

已買/未買/已付訂金（元）：未買預算/用途：主要為模擬器及steam上的遊戲,原本這幾天在看4070的單子,但怎麼選都超過35K的預算,趁現在跳水來撿一波,因為還有多加2個HDD及1個SSD,不確定 650W夠不夠用,在請大家看看這個預

[情報] 桃子十銓MP33PRO 512GB $999

[情報] 欣亞技嘉 RTX 4070 EAGLE OC 15990

[情報] 原價屋RTX4070再度跳水15990

來源:原價屋線上估價 5/17 20:40 技嘉 RTX4070 GAMING OC 12G(2565MHz/30cm/RGB三風扇)*需任搭技嘉產品▼下殺到 5/18 19:00, $20990↘$15990---------------

[心得] 全漢.技嘉.微星.十銓送修經驗

[開箱] ASUS TUF Gaming 850W Gold

[情報] 安耐美推出122mm的ATX3.1金靜冰核D.F. 12

[菜單] 30K 影像處理

已買/未買/已付訂金（元）：未買預算/用途：30K Adobe軟體使用(PS/LR/PR) 目前沒有遊戲需求之後或許有可能有但機會不高 CPU (中央處理器)：AMD【6核】Ryzen5 7500F MB (主機板)：華碩 PRIM

[菜單] 50K遊戲、剪片機

未買：預算/用途：特戰、Minicraft、OSU、法環、MH Wild、影片編輯、輕度直播 CPU (中央處理器)：Intel i5-14600KF MB (主機板)：華碩 TUF GAMING Z790-BTF WIFI RAM (記

Re: [閒聊] 君主被神化了吧

[心得] 華碩維修螢幕滿天星