※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

[新聞] 大模型Groq首秀引爆話題自研LPU服務速度遠快於GPU

時間2024-02-21 13:38:05

最新2024-02-21 19:33:00

留言94則留言，31人參與討論

推噓24 ( 26推2噓66→ )

原文標題：大模型Groq首秀引爆話題自研LPU服務速度遠快於GPU 原文連結： https://news.cnyes.com/news/id/5457929 發布時間： 2024-02-20 16:50 記者署名：鉅亨網新聞中心原文內容： ChatGPT 的新競爭對手 Groq 推出了語言處理單元 (LPU)，並於近期首度公開成果。當提示模型時，答案立即產生。而且，答案是依據事實，並引述來源，長達數百字，這讓它在社群媒體造成轟動。 Groq 憑藉的武器是語言處理單元 (LPU)。這項尖端技術的速度接近每秒 500 個 token 。它為數位處理的速度和效率樹立了新的基準。LPU 能將延遲降至最低而脫穎而出，提供了迄今為止聞所未聞的服務速度。據報導，Groq 的 LPU 旨在解決 CPU 和 GPU 等舊技術的限制。當面對大量運算需求時，傳統的處理架構往往無法滿足要求。 Groq 使用新的張量流處理器 (TPS) 架構來實現 LLM 運算。憑藉其快速推理和降低功耗的承諾，TPS 和 LPU 有望改變處理資料的方式。據 X 平台帳號 k_zer0s 發文表示，Groq 的 LPU 不需要像 Nvidia GPU 那樣快速的資料傳輸，因為它們的系統中沒有 HBM。它們使用 SRAM，其速度比 GPU 使用的速度大約快 20 倍。由於推理運行使用的資料比模型訓練少得多，因此 Groq 的 LPU 更節能。與用於推理任務的 Nvidia GPU 相比，它從外部記憶體讀取的資料更少，功耗也更少。 LPU 的運作方式與 GPU 不同。它使用臨時指令集電腦架構，因此不必像 GPU 使用高頻寬記憶體 (HBM) 那樣頻繁地從記憶體重新載入資料。這有助於避免 HBM 短缺問題並降低成本。 LPU 不像 GPU 需要超高速儲存。 Groq 聲稱其技術可以憑藉其強大的晶片和軟體在人工智慧任務中取代 GPU。 Google TPU 專案的先驅 Jonathan Ross 於 2016 年創立了 Groq。該公司迅速確立了自己在處理單元創新領域的領導者地位。 Ross 在人工智慧和處理技術方面的豐富背景推動了 LPU 的發展。 Groq 公司宣稱，其技術能夠透過其強大的晶片和軟體，在推理任務中取代 GPU 的角色。 Ross 曾表示，「Groq 的存在是為了消除『富人和窮人』，並幫助人工智慧社群中的每個人發展。而推理是實現這一目標的關鍵，因為『速度』是將開發人員的想法轉化為商業解決方案和改變生 APP 的關鍵」。心得/評論：如果真如報導所聲稱的那麼強, 那麼算力的要求就不需要那麼高? 成本可以大幅下降，對Nvidia是個挑戰另外該技術似乎不需要大量HBM，對這半年HBM的概念股MU、海力士也是挑戰 -- 被動收入存錢筒~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.126.254.52 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1708493887.A.2D9.html

94 則留言

推

jecint170702/21 13:39, 1F

過客?

推

NexusPrime02/21 13:42, 2F

真的這麼強那GPU要退下了嗎？

推

rxsmalllove02/21 13:44, 3F

觀望

→

BryceJames02/21 13:44, 4F

太棒了 NV殺手愈多 NV越漲

→

hbj194102/21 13:45, 5F

先聽聽再說，以前也有很多東西號稱強幾十倍，結果

→

hbj194102/21 13:45, 6F

都是假設

→

Tox02/21 13:46, 7F

不知道這公司講的是否真的那麼強,或是某些條件假設

推

emilchu9802/21 13:47, 8F

所以這幾天NV跌這個?

推

a200753502/21 13:47, 9F

Gemini 的 Demo都可以不講重點類造假了

→

a200753502/21 13:47, 10F

這種公司的也有可能只是來發個新聞騙個投資的

推

a090223681702/21 13:48, 11F

sram取代hbm

推

Homeparty02/21 13:55, 12F

吹

推

donkilu02/21 13:56, 13F

針對inference的加速器很多公司都有在做

→

donkilu02/21 13:58, 14F

但這種特化的解決方案也很容易跟不上日新月異的模型

推

renfro92802/21 14:05, 15F

https://i.imgur.com/GaRxzvs.jpg

→

imhan70502/21 14:05, 16F

不用去猜跌啥漲多回很正常的

推

Aska052002/21 14:05, 17F

這新聞應該還有後半段，Groq的綜合成本是NV的30多倍

→

Aska052002/21 14:06, 18F

要實際可以運行需要572張芯片成本高達1144萬美元

→

Aska052002/21 14:08, 19F

相比之下，8張H100的系統在性能上與Groq系統相當

→

Aska052002/21 14:08, 20F

但硬件成本只要30萬美

噓

polypress02/21 14:09, 21F

呃你要不要重看一次文章，再重寫一次心得

→

Aska052002/21 14:11, 22F

所以文章不能只看一半QQ

→

Altair02/21 14:12, 23F

原來CP值差太多...

→

bnn02/21 14:15, 24F

成本當然是以後量產才會降下來現在30倍又怎樣

推

Transposon02/21 14:15, 25F

沒有像菇狗、軟軟的規模，錢燒完就入土了

噓

fedona02/21 14:15, 26F

推理使用...

推

KrisNYC02/21 14:21, 27F

Cuda還比較萬用 TPS算是比較貴又功能單一的新解

→

KrisNYC02/21 14:21, 28F

是說你要繞過cuda幾十年的專利自己出一招真的很難

→

KrisNYC02/21 14:21, 29F

做到這樣已經真的很屌了

→

appledick02/21 14:22, 30F

感覺現在AI根本走錯方向了吧，去處理一些難度很高

→

appledick02/21 14:22, 31F

的模型運算或模擬才有意義吧，一直說文解字的到底三

→

appledick02/21 14:22, 32F

小

→

KrisNYC02/21 14:23, 33F

說文解字有市場性阿現在AI已經真的很多人在訂閱

→

KrisNYC02/21 14:23, 34F

真的很多公司實打實的在收訂閱錢進來了

→

KrisNYC02/21 14:23, 35F

chat gpt4免錢的去載來用英文跟他聊天看看

→

KrisNYC02/21 14:24, 36F

你會發現真的幾乎可以取代英文口說家教而且你跟他

→

KrisNYC02/21 14:24, 37F

聊什麼他都可以回答你 50年前的星戰到最新的電影

→

KrisNYC02/21 14:24, 38F

昨天晚上的特定某廠足球比賽他都可以跟你尬聊

→

KrisNYC02/21 14:25, 39F

你今天要去開一個會你大綱寫寫 chat GPT4開起來

→

KrisNYC02/21 17:57, 82F

過往錢不夠人不願意投資做不出來 AI進來以後

→

KrisNYC02/21 17:57, 83F

5年同團隊可以跑500次理論上會成功35件

→

KrisNYC02/21 17:57, 84F

不能投資的東西突然通通可以投資了這就是AI的魅力

→

KrisNYC02/21 17:58, 85F

我說的新合金比例試錯就是一個例子你可以想想

→

KrisNYC02/21 17:59, 86F

cyber trunk 捨棄了傳統的車架+板金結構研發了幾年

→

KrisNYC02/21 17:59, 87F

才找到兼顧可量產購強度可以使用的那個造型

→

KrisNYC02/21 18:00, 88F

以後要研發這種造型5年本來只能出一個變成能出50個

→

KrisNYC02/21 18:00, 89F

現有的車子要模組底盤和鋼架的基本邏輯直接推翻了

推

CaTkinGG02/21 18:20, 90F

百科+光碟真的是時代的眼淚大合體

推

bj4556602/21 19:32, 91F

你沒讀懂我的意思或你不是很瞭解 CS -- 我講的是「

→

bj4556602/21 19:32, 92F

已有數學證明是最佳演算法」的大量運算，像是 sorti

→

bj4556602/21 19:33, 93F

ng, shortest path,... 那些計算 AI 沒有插手的空

→

bj4556602/21 19:33, 94F

間，量子電腦反而可能有，總之和你講的東西非常不同

Tox 作者的近期文章

6Stock

[請益] 關於房租資料zillow與apartmentlist

27Stock

Re: [新聞] 2024年AI PC全面引爆!謝金河揭緯創等3檔接

25Stock

Re: [新聞] 港股失守萬六 13個月新低今年30家券商倒

現在港股就是信心都不見了，就被當垃圾在丟，簡單介紹3檔供有閒錢的可以考慮"各"擺個2%，擺個幾年看是否能成為樂透。工商銀行(HK:1398):中國前兩大銀行前十大客戶沒有房地產業者，前十大客戶佔放款18.6%(20

35Stock

[新聞] 碧桂園財務危機外媒：中國房地產最苦時

25Stock

Re: [心得] 長期投資0050無風險?

更多 Tox 作者的文章...

[新聞] 大模型Groq首秀引爆話題 自研LPU服務速度遠快於GPU

94 則留言

Tox 作者的近期文章

[新聞] 大模型Groq首秀引爆話題自研LPU服務速度遠快於GPU