※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

Re: [新聞] Nvidia 最大夢魘來臨！AI 聊天機器人執行 Groq LPU 比 GPU 快十倍

時間2024-02-24 18:22:48

最新2024-02-27 03:59:00

留言15則留言，14人參與討論

推噓9 ( 9推0噓6→ )

專用型跟泛用型不同 GpU 可執行繪圖渲染訓練 LLVM 什麼都可以 LPU 只能提供訓練後的LLVM 產生結果而且 GROQ 展示的參數遠比 openAI 70B 速度難比較況且 RAM 不知道開不能支持這麼多的 Token 就好像拿GPU 挖礦跟 ASIC 挖礦 GpU 不挖礦還有別的可以做 GROQ 不跑LLVM 就啥都不能做 ※ 引述《pl132 (pl132)》之銘言： : Nvidia 最大夢魘來臨！AI 聊天機器人執行 Groq LPU 比 GPU 快十倍 : http://tinyurl.com/2y4cehyv : 不論何種 AI 應用，速度非常重要。當我們要求熱門 AI 聊天機器人撰寫文章、電子郵件 : 或翻譯文稿時，我們會希望輸出結果愈快愈好。如今一家專為運行 AI 語言模型設計客製 : 化硬體，並致力提供更快 AI 的 Groq 公司，能以比普通人打字速度快 75 倍的速度呈現 : 結果。 : Groq 專為 AI、機器學習和高效能運算應用程式開發高效能處理器和軟體解決方案，千萬 : 不要和馬斯克（Elon Musk）的 Grok 聊天機器人混淆，它並非聊天機器人，而且這家總 : 部位於加州山景城（Mountain View）的公司目前沒有打算要訓練自己的 AI 語言模型， : 而會致力讓其他公司開發的模型高速運行。 : 當前幾乎所有 AI 工具都使用 GPU，但 Gorq 卻使用截然不同的硬體，亦即專為處理大型 : 語言模型（LLM）而設計的 LPU（Language Processing Unit，語言處理單元）。 : 由於 Groq 的 LPU 專門設計用於處理像是 DNA、音樂、程式碼及自然語言之類的資料序 : 列，因此在這類應用方面的處理效能遠勝 GPU。該公司宣稱，其用戶已經使用其引擎和 : API 運行 LLM 模型，其運行速度比基於 GPU 的替代方案快 10 倍。 : 目前 Grog 在自家官網上提供基於三種不同 LLM 模型（目前提供的模型包括 Meta 旗下 : Llama 2、法國新創 Mistal AI 旗下的 Mixtral-8x7B 和 Mistral 7B）的聊天機器人， : 使用者可以免費嘗試在 LPU 加持下的聊天機器人和一般 GPU 支援的效能有何不同 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 37.19.205.185 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1708770170.A.BF1.html

NvidiaAI

Re: 回文串

958

[新聞] Nvidia 最大夢魘來臨！AI 聊天機器人執

Tech_Job02/24 10:36

915

> Re: [新聞] Nvidia 最大夢魘來臨！AI 聊天機器人執

Tech_Job02/24 18:22

15 則留言

推

keelungReeve02/24 18:35, 1F

LLM喇

→

relaughter02/24 19:11, 2F

LLVM 是 compiler

→

musashi02302/24 19:31, 3F

LLVM xd

推

wrt02/24 19:34, 4F

不要笑，說不定真的是LLVM

推

abbei02/24 19:55, 5F

V for voice & video 我瞎掰的XD

→

celestialgod02/24 21:26, 6F

原文寫LLM 也可以抄成LLVM XDD

→

peter9802/24 21:27, 7F

不要笑不要笑

推

cosmo789702/24 22:30, 8F

看了推文才知道是在講LLM？

推

NCTU556602/24 22:34, 9F

LLVM不是compiler嗎？

推

shter02/24 23:27, 10F

GPU一開始也只是專用型，很晚期才拿來訓練

推

shter02/24 23:29, 11F

只能配合 OpenGL、DirectX 繪圖用

推

Dracarys02/25 03:11, 12F

笑到肚子痛

→

MTKer556602/25 14:00, 13F

用shader寫GPGPU表示

→

btpeter02/25 18:10, 14F

笑死一堆三腳貓…也在吹喇叭….

推

CuLiZn5602/27 03:59, 15F

我發現不管是誰，都能吹一嘴好AI，這難道不是泡沫

chengcti 作者的近期文章

6Tech_Job

Re: [新聞] 聯想台灣分公司傳裁員二成人力

-5Tech_Job

Re: [新聞] 省加班費？光寶科員工「打卡時間都一樣」

科技業都在家上班內湖很多家公司不刷卡你十點來上班也沒人理你這要打什麼卡？而且根本沒有卡鐘只有門禁資料聽說這家公司過段時間要推1/3 員工在家上班這樣怎麼打卡？科技業不會偷加班費只有傳產才會紅利發的就比加班費多了 ※ 引

[心得] NVIDIA面試心得（已刪內文）

抱歉，內容應公司要求下架，版主還沒回我幫刪文，我先自刪

86PC_Shopping

[情報] NVIDIA計畫第四季推出RTX5090！採用GDDR7

NVIDIA似乎已經準備就緒，計畫在今年第四季度推出下一代GeForce RTX 5090和RTX 5080 。這一舉措將有助於NVIDIA的板卡合作夥伴擴大出貨量尤其是隨著越來越多的玩家向高端升級，這些GPU的推出還將有助於提高GPU

82PC_Shopping

[情報] AMD認為自家顯卡驅動功能比NVIDIA更具優

AMD認為自家顯卡驅動功能比NVIDIA更具優勢能造成競爭都是好事 2024-01-12 By Lucky AMD 預計將會在 1 月 24 日推出名為「AMD Fluid Motion Frames」（AFMF）的新功能，可直接透過更新

50Tech_Job

[討論] Nvidia 資深員工呈「半退休」狀態

https://technews.tw/2023/12/15/senior-staff-half-retire-in-nvidia/ 作者黃嬿 | 發布日期 2023 年 12 月 15 日 12:13 | 分類人力資源 , 職場過

48Stock

Nvidia市值會不會衝上3兆美元？股價再漲78%就能

原文標題：Nvidia市值會不會衝上3兆美元？股價再漲78%就能辦到原文連結：https://reurl.cc/bDy32r 發布時間：2024-02-22 09:41 記者署名：經濟日報／編譯葉亭均／綜合外電原文內容：「AI第一

Tech_Job 板最新熱門文章

7Tech_Job

[請益] offer請益（廣達/緯穎）

各位年薪500w好小弟不才頭上電資學士畢業以下收到offer及口頭offer 因為新鮮人所以不太了解行情及未來發展想請問前輩們的建議 1. 公司：廣達bu9 職級：雲端網路switch硬體研發地點：龜山薪水：N-6*12+分紅（不

5Tech_Job

[新聞] 力積電啟用新廠總統.美.印.日.法代表皆

https://www.ntdtv.com.tw/b5/20240502/video/389456.html 力積電啟用新廠總統.美.印.日.法代表皆出席【新唐人亞太台 2024 年 05 月 02 日訊】台灣半導體實力受關注，晶圓代工

17Tech_Job

Re: [心得] 我從台積離職12年後

2010~2016走了好幾個認識的老人. 我老闆是在上一波大概2001年LCD好幾個廠成立時離開的，之後回來隔兩年又走. 201x年我幾個好朋友離開了，有的去外商，有的去豬屎屋，有的去三五族代工廠. 更多退休去宜蘭、花東、墾丁做民宿，所

59Tech_Job

[新聞] 今年要繳稅335萬…眾人秒跪！10年工程師

今年要繳稅335萬…眾人秒跪！10年工程師：感謝「海產店」照顧 https://finance.ettoday.net/news/2730751?from=fb_et_news_comment&fbclid=IwZXh0bgNhZW

14Tech_Job

科企裁員潮｜Google裁減至少200名「核心」團隊

https://inews.hket.com/article/3753047 科企裁員潮｜Google裁減至少200名「核心」團隊員工部分職位轉移到印度和墨西哥 Google母企Alphabet（美：GOOG）據報上星期公布季度業績前，已裁

7Tech_Job

Re: [心得] 電子業PM 面試紀錄（長文）

給原Po幾個建議 1. 電子or科技業男PM需要能說服主管你可以怎麼有效的跟工程師合作 2. 要盤點一下你的工作經驗裡面權力vs 責任以及利害關係者之間的關係 3. PM的價值是能以他的視角來下當下最好的決策，所以要思考自己過去是否對專案有

37Tech_Job

[新聞] 那「一通電話」白打了？台積電恐放棄在

那「一通電話」白打了？台積電恐放棄在銅鑼建先進封裝廠〔記者洪友芳／新竹報導〕晶圓代工廠力積電（6770）今（2）日上午將舉行竹科銅鑼園區12吋廠落成典禮，台積電原預計斥資9百億元在銅鑼園區興建先進封裝廠，目前仍無動靜，業界傳出台積電已