※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

Re: [閒聊]AMD顯卡可以跑CUDA程式，那就不必特地買N

時間2024-03-02 09:05:22

最新2024-03-03 14:05:00

留言76則留言，23人參與討論

推噓23 ( 24推1噓51→ )

各位早安，這裡是禮拜六早上的 R&D。 ※ 引述《amduser (重返榮耀)》之銘言： : 　 : 之前新聞 : https://news.mydrivers.com/1/963/963717.htm : 　 : NVIDIA CUDA通過多年耕耘，鑄就了牢不可破的生態壁壘，外人各種嘗試都無法進入，包 : 括AMD ROCm開發平台，但其實也不是沒有辦法。 : 開發者Andrzej Janik就憑借一己之力，借助Intel oneAPI，開發了CUDA兼容方案“ZLUDA : ”，能夠在Intel硬件上原生運行CUDA應用，后來就被停了 : 之后在AMD的支持下，ZLUDA重啟了該項目，能夠讓AMD顯卡原生運行CUDA應用，不需要任 : 何轉移，也不需要調整代碼。 : 唯一要做的，就是用ZLUDA庫替代CUDA。 : 雖然它不能保證每一款CUDA應用都跑起來，但已經是以一個巨大的突破。 : 非常可惜，AMD支持這一項目做了兩年，也給停了——不知道是不是受到了NVIDIA的壓力 : 。 : 幸運的是，ZLUDA項目并未徹底消散，已經免費開源，感興趣有能力的開發者都可以使用 : ，而且確認可以在AMD ROCm平台上無縫運行CUDA應用。 : 比如說，可以將CUDA作為Blender 4.0或者V-Ray的渲染API，尤其是Blender本來就有 : Radeon HIP計算渲染器，如今跑在ZLUDA上速度還會更快。 : Andrzej Janik也在繼續研究ZLUDA，其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。 : 內部測試表明，對比OpenCL方案，其性能大部分時候都更好，最多可以領先超過75％，但 : 因為還在開發之中，部分時候效率反而更低。 : 　 : 大家都知道NVIDIA最喜歡搞特規G-SYNC、DLSS、CUDA、閉源軟體一大堆不開放給其他家用 : ，現在ZLUDA可以讓AMD顯卡跑CUDA程式，那以後就不必特地買N卡了，應該以後會有人拿 : AMD顯卡來搞AI了吧！ : 　 : https://github.com/vosen/ZLUDA : 　 ZLUDA 這東西我研究過一陣子，當然不是現在這個 Fork，而是三年前那個版本。平台使用 Ubuntu 22.04 64bit 我研究後發現 ZLUDA 的運作原理是這樣： ZLUDA 會去模擬一套 CUDA API，然後內部再自己實現功能。這代表什麼呢？假設你有一套程式支援 CUDA 8 好了，現在 CUDA 要更新變成 CUDA 9 囉！ N 家能在歷史版本裡面找到舊版CUDA來套，那你程式就能順利跑了。如果你用 ZLUDA ，之前的問題就是他只支援某特定版本 CUDA，還沒有 Released 他是 depend 哪一版？ ZLUDA 是照某板的 API 下去寫的！所以你想支援機器學習框架？（e.g. TensorFlow, PyTorch）那要先找到這個是用哪版 CUDA，找到後還要確定這版的框架你裝得起來。個人是認為這難度： https://i.imgur.com/OBzSNCH.gif

除去框架，實測能夠用 ZLUDA 跑起來的 CUDA 程式： Geekbench 5 也嘗試過從底層像是 Numba 重寫演算法拿去 Benchmark performance 。一樣遇到 Numba 卡版本問題。退一萬步說 ZLUDA 可能有用，但是老黃一版更他就會死翹翹，而且死很久。開源的東西都這樣，蘇媽也不是做慈善的。既然主流的框架（e.g. PyTorch）都有支援 ROCm，幹嘛出大錢搞 ZLUDA？結論： ZLUDA 要真正可以商用，就是要有人花錢去幫每一版 CUDA 寫 API，然後拿出一張表對標版本支援才有用。現在商用想逃離 NV 還是推 OpenCL 解決方案，以上。 -- 作者 villagermess (我是女生) 看板 Tech_Job 標題 [討論] 為什麼不開基本薪資然後分紅給50萬時間 Fri May 14 10:21:35 2021 ───────────────────────────────────────

→ supereva: 只能吸引你不能吸引人才05/14 10:31

→ supereva: 所以沒人這樣開05/14 10:32

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.170.78.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1709341524.A.970.html

AMD顯卡

Re: 回文串

1958

[閒聊]AMD顯卡可以跑CUDA程式，那就不必特地買N

PC_Shopping03/01 22:39

2376

> Re: [閒聊]AMD顯卡可以跑CUDA程式，那就不必特地買N

PC_Shopping03/02 09:05

76 則留言

→

crimsonmoon903/02 09:07, 1F

跟wine概念差不多？111.83.80.84

※ 編輯: wuyiulin (1.170.78.182 臺灣), 03/02/2024 09:11:05

推

kira92503/02 09:18, 2F

應該就是然後這部分除非CUDA的API公開42.72.91.105

→

kira92503/02 09:18, 3F

不然很難跟得到42.72.91.105

→

kira92503/02 09:19, 4F

你也不是有個Valve 盡量幫你通通接好42.72.91.105

→

enonrick03/02 09:36, 5F

就好像買mac裝windows 一樣, 不用人家61.231.5.191

→

enonrick03/02 09:36, 6F

的生態還要裝，要泡cuda 買nv 就好，61.231.5.191

→

enonrick03/02 09:36, 7F

qemu 比較貼切61.231.5.191

→

soulgem03/02 09:37, 8F

或是 Windows 內的 WSL 跟真 linux140.112.30.188

推

oopFoo03/02 09:48, 9F

不只是版本問題，ZLUDA三年後還是Alpha版219.70.128.119

→

oopFoo03/02 09:49, 10F

相容性很差，除了一些Benchmark，正常程式219.70.128.119

→

oopFoo03/02 09:51, 11F

幾乎沒一個可用。最重要的Pytorch支援也完219.70.128.119

→

oopFoo03/02 09:52, 12F

全不行。Intel跟AMD都相繼放棄不是沒原因219.70.128.119

推

twinkleAshed03/02 10:23, 13F

對AMD on Windows來說,223.136.64.62

→

twinkleAshed03/02 10:23, 14F

就像是效率比較好的DirectML.223.136.64.62

推

afacebook03/02 10:23, 15F

借問Rocm目前支援度如何180.217.245.102

→

afacebook03/02 10:23, 16F

推薦買嗎180.217.245.102

推

afacebook03/02 10:24, 17F

pytorch180.217.245.102

推

afacebook03/02 10:26, 18F

linux系統的話180.217.245.102

推

oopFoo03/02 10:34, 19F

Pytorch支援ROCM，但要有能力debug，219.70.128.119

→

oopFoo03/02 10:35, 20F

最好用docker，常常需要重新設定。最重要219.70.128.119

→

oopFoo03/02 10:37, 21F

的事，選有支援GPU，現在要7900xtx/xt/gre219.70.128.119

推

nicetw20xx03/02 10:50, 22F

推36.234.36.167

→

friedpig03/02 11:11, 23F

牙膏one API 有一部分是在做類似的事情125.228.96.10

→

friedpig03/02 11:11, 24F

啊不過人家是商業團隊一堆人在寫都問125.228.96.10

→

friedpig03/02 11:11, 25F

題不少了125.228.96.10

推

avans03/02 11:45, 26F

推實測說明111.71.102.21

→

Ceferino03/02 11:55, 27F

7系列都能跑rocm啊至少我畫圖沒問題，123.193.242.14

→

Ceferino03/02 11:55, 28F

誰說要7900的123.193.242.14

→

qazws93103/02 11:56, 29F

你先看那是什麼ID61.230.198.196

推

oppoR2003/02 12:23, 30F

https://bit.ly/49VCNGx123.195.146.51

→

oppoR2003/02 12:24, 31F

人家在問linux跑pytorch rocm結果你在說123.195.146.51

→

oppoR2003/02 12:24, 32F

畫圖更好笑的是有人要洗別人粉絲意向單123.195.146.51

→

oppoR2003/02 12:24, 33F

官方就真的寫只支援那三張（遊戲卡）123.195.146.51

→

Ceferino03/02 12:26, 34F

沒有裝過的別裝懂好嗎123.193.242.14

→

crimsonmoon903/02 12:30, 35F

官方只有保證那三張可以穩跑其他出111.83.80.84

→

crimsonmoon903/02 12:30, 36F

錯要自己debug111.83.80.84

→

crimsonmoon903/02 12:31, 37F

SD在linux上是用ROCm的torch框架111.83.80.84

推

gameguy03/02 13:02, 38F

對公司這等級的就花錢了事買Nvidia工程繪180.217.15.184

→

gameguy03/02 13:02, 39F

圖卡，在誰在跟你搞土炮在那搞來搞去的180.217.15.184

推

afacebook03/02 19:15, 64F

我看7900xtx fp32比4080s還高1.171.164.132

推

oopFoo03/02 19:36, 65F

可以嘗試，但4080s的ai會比較強，n家有219.70.128.119

→

oopFoo03/02 19:36, 66F

tensor core。但7900xtx有24GB，大記憶體219.70.128.119

→

oopFoo03/02 19:37, 67F

比效能要重要。219.70.128.119

推

oopFoo03/02 19:39, 68F

但這建立在你能處理問題上。n家的ai是沒219.70.128.119

→

oopFoo03/02 19:40, 69F

煩惱，支援完整。219.70.128.119

→

d851155703/02 19:58, 70F

AMD這點沒辦法.但時間可以解決就是114.36.21.67

→

d851155703/02 19:59, 71F

AI方面A卡支援度會越來越好就是.114.36.21.67

→

d851155703/02 19:59, 72F

不考慮生產力7900XTX就是比4080S強的114.36.21.67

推

tcchu03/02 20:06, 73F

nvidia f u1.200.150.242

推

aegis4321003/02 21:21, 74F

tensor core要L40s才完全解放性能175.182.111.21

推

kira92503/03 14:04, 75F

畢竟大家都要Second Source220.135.86.145

→

kira92503/03 14:05, 76F

牙膏看起來就是沒有方案 Altera 都拆分了220.135.86.145

wuyiulin 作者的近期文章

各位午安，於上週試行的耳機板水桶機器人告一段落。以下是本次的試行報告：本次機器人總共水桶了 4 個人，誤殺率則為：50％。有點高阿（＃。以下是 log 及修復辦法： Date: 2024-03-03 09:37:16, UID: a

67Headphone

[公告] 自動水桶機器人試行預告

米娜桑空班蛙這裡是耳機板公僕 wuyiulin 身為公僕，遇到最大宗問題的板務就是未滿三篇的交易文違規。大約三年前，我們有試行過自動水桶機器人來解決此問題，當時因為技術問題，會一直水桶到某位板眾而告終。都 2024 年了，除了

17Kaohsiung

[閒聊] 極其成功的高雄輕軌遊園馬車

17TaichungBun

[請益] 臺中市區哪裡有賣 Dr. Pepper

43C_Chat

Re: [問題] 有沒有iWin懶人包？

一派胡言，這裡是機掰客家人的啦。先就討論“二次元蘿莉圖”，我覺得這個跟兒少法會有關根本過度解釋。兒少法在這邊是保護真實兒童不被怪阿姨/叔叔侵犯，對吧？退一萬步舉例，看了電車癡漢 A片真的起心動念去猥褻電車乘客的有多少？這個犯意轉

19Soft_Job

[請益] CUDA 與 OpenCL 的技能路線選擇？

小弟做影像演算法的，之前技能都點在用框架實現演算法（PyTorch、OpenCV、OpenVino…）。在工作上有個機緣能夠把工時投入 CUDA 或是 OpenCL 的演算法重構（加速）開發。目前的狀況是因為產品軟硬體環境的關係，

6StupidClown

[大哭] 溫暖的茶水間

大家好，這裡是客家人工程師的啦。公司裡面有很多個茶水間，但是我很喜歡去辦公室座位那層的那間，因為感覺那邊特別溫暖！每當我程式寫不出來的時候，就會去那邊待五分鐘。有次同事案子壓死線準備加班的時候，我就推薦他去那裡裝水，說那邊特

更多 wuyiulin 作者的文章...