※ 本文轉寄自 ptt.cc, 文章原始頁面
標題

Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N

最新2024-03-03 14:05:00
留言76則留言,23人參與討論
推噓23 ( 24151 )
各位早安, 這裡是禮拜六早上的 R&D。 ※ 引述 《amduser (重返榮耀)》 之銘言: :   : 之前新聞 : https://news.mydrivers.com/1/963/963717.htm :   : NVIDIA CUDA通過多年耕耘,鑄就了牢不可破的生態壁壘,外人各種嘗試都無法進入,包 : 括AMD ROCm開發平台,但其實也不是沒有辦法。 : 開發者Andrzej Janik就憑借一己之力,借助Intel oneAPI,開發了CUDA兼容方案“ZLUDA : ”,能夠在Intel硬件上原生運行CUDA應用,后來就被停了 : 之后在AMD的支持下,ZLUDA重啟了該項目,能夠讓AMD顯卡原生運行CUDA應用,不需要任 : 何轉移,也不需要調整代碼。 : 唯一要做的,就是用ZLUDA庫替代CUDA。 : 雖然它不能保證每一款CUDA應用都跑起來,但已經是以一個巨大的突破。 : 非常可惜,AMD支持這一項目做了兩年,也給停了——不知道是不是受到了NVIDIA的壓力 : 。 : 幸運的是,ZLUDA項目并未徹底消散,已經免費開源,感興趣有能力的開發者都可以使用 : ,而且確認可以在AMD ROCm平台上無縫運行CUDA應用。 : 比如說,可以將CUDA作為Blender 4.0或者V-Ray的渲染API,尤其是Blender本來就有 : Radeon HIP計算渲染器,如今跑在ZLUDA上速度還會更快。 : Andrzej Janik也在繼續研究ZLUDA,其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。 : 內部測試表明,對比OpenCL方案,其性能大部分時候都更好,最多可以領先超過75%,但 : 因為還在開發之中,部分時候效率反而更低。 :   : 大家都知道NVIDIA最喜歡搞特規G-SYNC、DLSS、CUDA、閉源軟體一大堆不開放給其他家用 : ,現在ZLUDA可以讓AMD顯卡跑CUDA程式,那以後就不必特地買N卡了,應該以後會有人拿 : AMD顯卡來搞AI了吧! :   : https://github.com/vosen/ZLUDA :   ZLUDA 這東西我研究過一陣子, 當然不是現在這個 Fork, 而是三年前那個版本。 平台使用 Ubuntu 22.04 64bit 我研究後發現 ZLUDA 的運作原理是這樣: ZLUDA 會去模擬一套 CUDA API, 然後內部再自己實現功能。 這代表什麼呢? 假設你有一套程式支援 CUDA 8 好了, 現在 CUDA 要更新變成 CUDA 9 囉! N 家能在歷史版本裡面找到 舊版CUDA來套, 那你程式就能順利跑了。 如果你用 ZLUDA , 之前的問題就是他只支援某特定版本 CUDA, 還沒有 Released 他是 depend 哪一版? ZLUDA 是照某板的 API 下去寫的! 所以你想支援機器學習框架? (e.g. TensorFlow, PyTorch) 那要先找到這個是用哪版 CUDA, 找到後還要確定這版的框架你裝得起來。 個人是認為這難度: https://i.imgur.com/OBzSNCH.gif
Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N
除去框架, 實測能夠用 ZLUDA 跑起來的 CUDA 程式: Geekbench 5 也嘗試過從底層像是 Numba 重寫演算法 拿去 Benchmark performance 。 一樣遇到 Numba 卡版本問題。 退一萬步說 ZLUDA 可能有用, 但是老黃一版更他就會死翹翹, 而且死很久。 開源的東西都這樣,蘇媽也不是做慈善的。 既然主流的框架(e.g. PyTorch) 都有支援 ROCm,幹嘛出大錢搞 ZLUDA? 結論: ZLUDA 要真正可以商用, 就是要有人花錢去幫每一版 CUDA 寫 API, 然後拿出一張表對標版本支援才有用。 現在商用想逃離 NV 還是推 OpenCL 解決方案, 以上。 -- 作者 villagermess (我是女生) 看板 Tech_Job 標題 [討論] 為什麼不開基本薪資 然後分紅給50萬 時間 Fri May 14 10:21:35 2021 ───────────────────────────────────────
supereva: 只能吸引你 不能吸引人才05/14 10:31
supereva: 所以沒人這樣開05/14 10:32
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.170.78.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1709341524.A.970.html

Re: 回文串

2376
> Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N
PC_Shopping03/02 09:05

76 則留言

crimsonmoon9, 1F
跟wine概念差不多?111.83.80.84
※ 編輯: wuyiulin (1.170.78.182 臺灣), 03/02/2024 09:11:05

kira925, 2F
應該就是 然後這部分除非CUDA的API公開42.72.91.105

kira925, 3F
不然很難跟得到42.72.91.105

kira925, 4F
你也不是有個Valve 盡量幫你通通接好42.72.91.105

enonrick, 5F
就好像買mac裝windows 一樣, 不用人家61.231.5.191

enonrick, 6F
的生態還要裝, 要泡cuda 買nv 就好 ,61.231.5.191

enonrick, 7F
qemu 比較貼切61.231.5.191

soulgem, 8F
或是 Windows 內的 WSL 跟真 linux140.112.30.188

oopFoo, 9F
不只是版本問題,ZLUDA三年後還是Alpha版219.70.128.119

oopFoo, 10F
相容性很差,除了一些Benchmark,正常程式219.70.128.119

oopFoo, 11F
幾乎沒一個可用。最重要的Pytorch支援也完219.70.128.119

oopFoo, 12F
全不行。Intel跟AMD都相繼放棄不是沒原因219.70.128.119

twinkleAshed, 13F
對AMD on Windows來說,223.136.64.62

twinkleAshed, 14F
就像是效率比較好的DirectML.223.136.64.62

afacebook, 15F
借問Rocm目前支援度如何180.217.245.102

afacebook, 16F
推薦買嗎180.217.245.102

afacebook, 17F
pytorch180.217.245.102

afacebook, 18F
linux系統的話180.217.245.102

oopFoo, 19F
Pytorch支援ROCM,但要有能力debug,219.70.128.119

oopFoo, 20F
最好用docker,常常需要重新設定。最重要219.70.128.119

oopFoo, 21F
的事,選有支援GPU,現在要7900xtx/xt/gre219.70.128.119

nicetw20xx, 22F
36.234.36.167

friedpig, 23F
牙膏one API 有一部分是在做類似的事情125.228.96.10

friedpig, 24F
啊 不過人家是商業團隊一堆人在寫 都問125.228.96.10

friedpig, 25F
題不少了125.228.96.10

avans, 26F
推實測說明111.71.102.21

Ceferino, 27F
7系列都能跑rocm啊至少我畫圖沒問題,123.193.242.14

Ceferino, 28F
誰說要7900的123.193.242.14

qazws931, 29F
你先看那是什麼ID61.230.198.196

oppoR20, 30F

oppoR20, 31F
人家在問linux跑pytorch rocm結果你在說123.195.146.51

oppoR20, 32F
畫圖 更好笑的是有人要洗別人粉絲意向單123.195.146.51

oppoR20, 33F
官方就真的寫只支援那三張(遊戲卡)123.195.146.51

Ceferino, 34F
沒有裝過的別裝懂好嗎123.193.242.14

crimsonmoon9, 35F
官方只有保證那三張可以穩跑 其他出111.83.80.84

crimsonmoon9, 36F
錯要自己debug111.83.80.84

crimsonmoon9, 37F
SD在linux上是用ROCm的torch框架111.83.80.84

gameguy, 38F
對公司這等級的就花錢了事買Nvidia工程繪180.217.15.184

gameguy, 39F
圖卡,在誰在跟你搞土炮在那搞來搞去的180.217.15.184

afacebook, 64F
我看7900xtx fp32比4080s還高1.171.164.132

oopFoo, 65F
可以嘗試,但4080s的ai會比較強,n家有219.70.128.119

oopFoo, 66F
tensor core。但7900xtx有24GB,大記憶體219.70.128.119

oopFoo, 67F
比效能要重要。219.70.128.119

oopFoo, 68F
但這建立在你能處理問題上。n家的ai是沒219.70.128.119

oopFoo, 69F
煩惱,支援完整。219.70.128.119

d8511557, 70F
AMD這點沒辦法.但時間可以解決就是114.36.21.67

d8511557, 71F
AI方面A卡支援度會越來越好就是.114.36.21.67

d8511557, 72F
不考慮生產力7900XTX就是比4080S強的114.36.21.67

tcchu, 73F
nvidia f u1.200.150.242

aegis43210, 74F
tensor core要L40s才完全解放性能175.182.111.21

kira925, 75F
畢竟大家都要Second Source220.135.86.145

kira925, 76F
牙膏看起來就是沒有方案 Altera 都拆分了220.135.86.145

wuyiulin 作者的近期文章

[公告] 水桶機器人試行報告
各位午安,於上週試行的耳機板水桶機器人告一段落。 以下是本次的試行報告: 本次機器人總共水桶了 4 個人,誤殺率則為:50%。 有點高阿(#。 以下是 log 及修復辦法: Date: 2024-03-03 09:37:16, UID: a
[公告] 自動水桶機器人試行預告
米娜桑空班蛙 這裡是耳機板公僕 wuyiulin 身為公僕, 遇到最大宗問題的板務就是未滿三篇的交易文違規。 大約三年前, 我們有試行過自動水桶機器人來解決此問題, 當時因為技術問題,會一直水桶到某位板眾而告終。 都 2024 年了, 除了
Re: [問題] 有沒有iWin懶人包?
一派胡言,這裡是機掰客家人的啦。 先就討論“二次元蘿莉圖”, 我覺得這個跟兒少法會有關根本過度解釋。 兒少法在這邊是保護真實兒童不被怪阿姨/叔叔侵犯,對吧? 退一萬步舉例, 看了電車癡漢 A片真的起心動念去猥褻電車乘客的有多少? 這個犯意轉
[請益] CUDA 與 OpenCL 的技能路線選擇?
小弟做影像演算法的, 之前技能都點在用框架實現演算法 (PyTorch、OpenCV、OpenVino…)。 在工作上有個機緣能夠把工時投入 CUDA 或是 OpenCL 的演算法重構(加速)開發。 目前的狀況是因為產品軟硬體環境的關係,
[大哭] 溫暖的茶水間
大家好,這裡是客家人工程師的啦。 公司裡面有很多個茶水間, 但是我很喜歡去辦公室座位那層的那間, 因為感覺那邊特別溫暖! 每當我程式寫不出來的時候, 就會去那邊待五分鐘。 有次同事案子壓死線準備加班的時候, 我就推薦他去那裡裝水, 說那邊特
更多 wuyiulin 作者的文章...