※ 本文轉寄自 ptt.cc, 文章原始頁面

看板Stock

作者oopFoo (3d)

標題

Re: [新聞] 輝達H100晶片紓壓了訂單大戶開始轉售

時間2024-02-29 08:06:42

最新2024-03-02 03:01:00

留言212則留言，121人參與討論

推噓10 ( 50推40噓122→ )

回文4則回文

千禧年的網路泡沫，也是先炒作硬體商，Cisco, Sun...，Sun還有"dot in dot-com"的廣告。網路確實是改變世界，但真正大賺的是軟體公司，而且是完全新鮮的軟體公司。這次AI浪潮，應該也是類似。 N家這次炒作這麼高，是因為真的，Compute是供不應求。每個大公司都怕買不夠，跟不上。但最近一些AI的發展，也許會發現，這些Compute是不需要的。 Mamba, RetNet, RWKV是從"Attention"的這點來改善。"Attention"是Quadratic Complexity，這是硬體需求的關鍵。現在在找方法從Quadratic改成Linear。 Mamba我很看好，它的作者之一也是"Flash Attention"的作者。但昨天一篇新的論文，可能是真的翻天覆地的開始。 https://arxiv.org/abs/2402.17764 "The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits" https://news.ycombinator.com/item?id=39535800 hn的討論。現在討論的共識是，可行，理論基礎很扎實。各路人馬開始指出，從2006年開始的這方面研究，已經找出好多篇證實這方向是可行的。現在的LLM是用fp16(16bits)，這方法可1.58bits，(討論說可以縮到0.68bits) 然後本來是fp dot product的只要int add。輕鬆10x的效能，新ASIC針對Ternary weight發展可以輕鬆100x的效能改善？如果這篇證實是可行的，AI起跑點重新設置，所有公司的價值都要重新計算。這篇的作者群很有資歷，但很有趣的是，主要是來自北京/清華大學。美國猛力壓制中國的運力運算，造就不太需要Compute的方法的發現，戳破美國AI泡沫，這會是非常的諷刺。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1709165206.A.DEA.html

輝達

Re: 回文串

119269

[新聞] 輝達H100晶片紓壓了訂單大戶開始轉售

Stock02/28 16:33

10212

> Re: [新聞] 輝達H100晶片紓壓了訂單大戶開始轉售

Stock02/29 08:06

115257

Re: [新聞] 輝達H100晶片紓壓了訂單大戶開始轉售

Stock02/29 11:38

1939

Re: [新聞] 輝達H100晶片紓壓了訂單大戶開始轉售

Stock03/03 01:59

212 則留言

推

addy753396702/29 08:08, 1F

蒜粒概念股有嗎

推

YummyLin212002/29 08:10, 2F

可惜民進黨逢中必反根本反智

推

leochen12402/29 08:11, 3F

中國沒有a100也可以發論文？

推

patrol02/29 08:13, 4F

嗯，先拿點實際的東西出來看看

→

sirins02/29 08:13, 5F

種蒜用農藥，重返榮耀哪一間我就不說了

→

poisonB02/29 08:14, 6F

說得很好繼續加油啦

噓

fedona02/29 08:16, 7F

實作的出來再吹

推

apple12377302/29 08:16, 8F

這時候崩真的好，大家就可以xdd

→

kausan02/29 08:16, 9F

算力需求根本沒極限結案

推

wUbInG02/29 08:17, 10F

可惜民進黨逢中必反根本反智

→

otaku69002/29 08:17, 11F

對於降低資料頻寬的追求跟美國打不打壓沒關係啦

噓

iamchuan31402/29 08:18, 12F

喔

噓

zxcvb123452202/29 08:21, 13F

投資那麼多算力，結果沒辦法賺錢，目前很多AI產品

→

zxcvb123452202/29 08:21, 14F

的狀況

推

audic02/29 08:21, 15F

沒有算力才在那邊搞五四三，最終還是回歸算力追求

噓

hwei958290502/29 08:21, 16F

大紀元

→

audic02/29 08:22, 17F

跟縮小晶片跟先進封裝兩條線不衝突一樣

→

mojito88802/29 08:22, 18F

理論上時光機也做得出來，理論上啦！中或贏，要加

→

mojito88802/29 08:23, 19F

油餒…

推

ppon02/29 08:23, 20F

之前以太幣也是出現更有效率的挖礦法結果沒人再用

→

ppon02/29 08:23, 21F

顯卡挖 AI感覺也是遲早的事

→

emind02/29 08:25, 22F

美國用這個技術訓練更大的模型？

噓

tttt020402/29 08:25, 23F

中文太爛，重寫一遍

推

littlejackbr02/29 08:26, 24F

我很懷疑你到底知不知道自己在講什麼

推

herculus650202/29 08:27, 25F

https://www.youtube.com/watch?v=Gtf3CxIRiPk

→

AGODC02/29 08:28, 26F

就是沒算力才在那邊搞東搞西的，等這東西真的弄出來

→

AGODC02/29 08:28, 27F

，人家瘋狂買算力的都跑多遠了？

推

s5656556612302/29 08:29, 28F

好了啦你賺多少

噓

WTF5566556602/29 08:30, 29F

優化架構本來就一直存在把這個扯成跟打壓晶片有關

→

WTF5566556602/29 08:30, 30F

？問號

→

WTF5566556602/29 08:30, 31F

還在理論可行沒實作的東西看看就好不要又搞個超導

→

WTF5566556602/29 08:30, 32F

體笑話

→

henry200306102/29 08:30, 33F

你是誰

→

kausan02/29 08:31, 34F

這麼說好了 gpu遲早會降價沒錢的公司可以等價格合

→

kausan02/29 08:31, 35F

理再買阿

噓

powerkshs02/29 08:31, 36F

又是太監在自慰不用性生活ㄏㄏ

推

herrowui02/29 08:31, 37F

大學的論文著重在理論，是的理論！！

→

c92802/29 08:32, 38F

這文字看了就頭痛

噓

ck32602/29 08:33, 39F

看到吹強國就可以不用看了

推

shadtalker02/29 14:08, 200F

扯到底中國為何CV LLM可以這麼強

→

yiersan02/29 14:48, 201F

中國自我安慰罷了可憐那

→

vacuityhu02/29 17:40, 202F

不是啊...就算真的能無損效能改int, 那改完int省出

→

vacuityhu02/29 17:40, 203F

來的算力我也可以繼續擴增模型尺寸啊, 模型變大能

→

vacuityhu02/29 17:40, 204F

做的事更多更好一樣甩你好幾個車身, 不加大模型我

→

vacuityhu02/29 17:40, 205F

也可以加快運算效率啊, 影片即時翻譯字幕比你快比

→

vacuityhu02/29 17:40, 206F

你精準還是把你壓在地上摩擦, 追根究底算力碾壓的

→

vacuityhu02/29 17:40, 207F

前提下還在妄想什麼彎道超車？

噓

sa87a1602/29 19:16, 208F

連晶片都要手工的國家，你吹慢慢吹

→

sa87a1602/29 19:17, 209F

上次一堆韭菜被詐騙，這次一定不一樣對不對

→

musie03/02 02:58, 210F

笑死一堆不懂AI的在亂噓我公司在小模型可以重現

→

musie03/02 02:58, 211F

這對降低成本還有inference速度有很大的影響

→

musie03/02 03:01, 212F

這是今年以來最重要的Paper

oopFoo 作者的近期文章

8Soft_Job

Re: [討論] Google開發工具工程總監：Rust 開發者的

※ 引述《Lushen (pttlushen)》之銘言： : Google開發工具工程總監：Rust 開發者的生產力是 C++ 的兩倍 : https://bit.ly/3JASfNe 另外一個相反的例子。 https://loglog.g

14PC_Shopping

Re: [情報] 英特爾認錯…擴大釋單台積操刀範圍擴及

※ 引述《AquaChen1012 (阿扁)》之銘言： : 英特爾執行長基辛格在法人會議中表示，英特爾晶片代工業務受到決策錯誤的拖累，包括 : 一年前反對使用荷蘭ASML的EUV設備。基辛格說，部分由於這些失誤，英特爾已將晶圓總 : 數的約

11Emulator

[新聞] Yuzu Citra開發團隊賠償2.4M鎂和解

https://storage.courtlistener.com/recap/gov.uscourts.rid.56980/gov.uscourts.rid.56980.10.0.pdf https://reurl.cc/VNolp6 Y

9PC_Shopping

Re: [情報] Intel 的 15700K 15900K 消息曝光

36PC_Shopping

[情報] MSI 6800/6800XT 特價$12990

7PC_Shopping

Re: [情報] Intel下放APO至12/13代CPU舊代K系列CPU

※ 引述《musashi023 (太陽魚)》之銘言： : 嗨蓋斯 : 最近下班在研究Qt multithreading, 對於把CPU性能榨乾覺得蠻有成就感的 : 就搞了一本 C++ Concurrency in Action 來翻翻除非

39PC_Shopping

[閒聊] Steam Deck的Van Gogh APU有個隱藏的NPU

更多 oopFoo 作者的文章...

Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售

輝達

Re: 回文串

212 則留言

oopFoo 作者的近期文章

Re: [新聞] 輝達H100晶片紓壓了訂單大戶開始轉售