※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Stock
標題

Re: [閒聊] 傳Coreweave是Nvidia和Blackroc

時間
留言104則留言,25人參與討論
推噓22 ( 26474 )
先說結論: 珍惜生命, 遠離妖股 你不看好空手就好, 不要去放空, 妖股的漲跌是華爾街早餐桌上聊天決定的 再來說Coreweave這家公司, 對, 這就是家空殼公司, 這是crunchbase 裡頭的資訊, 過幾天可能會被刪掉避風頭, 所以我先在這裡備份資訊, https://www.crunchbase.com/organization/coreweave/people Brian Venturo Co-Founder and CTO https://www.linkedin.com/in/brian-v-6719b812/ Haverford College Bachelors, Economics Partner Hudson Ridge Asset Management LLC Michael Intrator Co-Founder and CEO CTO 是經濟系畢業, 前一份工作是在華爾街賣CDO, CEO 歷史系/人資系畢業, 前一份工作在華爾街賣CDO, 整間公司沒有任何一個人懂技術, 不過我相信這公司一定跟華爾街關係很好 Coreweave 之前是作加密貨幣, 應該就是做雲端挖礦機出租, 現在用一模一樣的概念跟同樣NVDA 的機器, 把挖礦機改名成為AI 機器繼續做雲端出租, 這種東西是投機到不行的, 基本上碰CDO, 加密貨幣, 挖礦機這些東西都是超級投機 我們就來談技術, 這是他們的官網: https://www.coreweave.com/ 基本上就是用open source 的 kubernetes (我前面文章有解釋), 這樣要跟其他雲端大廠競爭? 更何況kubernetes 是GOOG 開發的 三大廠AWS/MSFT/GOOG 現在之所有用 H100 並不是真的無法取代H100, 而是跟華爾街以及炒股大戶的AI 科學家們妥協, 不用H100 就會被華爾街認為沒有 AI 競爭力, 公司股價暴跌, 不用H100 就會被AI 科學家們認為平台難用難開發, 但是這只是目前的妥協 其實如果底層不要用CUDA, 可以有非常多的其他選擇, 像是OpenCL/OpenGL 等, 硬體可以用TPU, AMD, 自製ASIC 等等, 真的不是非用H100 不可 我在雲端市場研發也算是有一段時間, 雲端市場很難打進去的, 一大堆奧客, 就像我前面說的AI 科學家們沒有CUDA 就不會寫代碼, 我跟他們解釋半天用OpenCL 用Tensorflow, 他們就是不願意接受, 誰叫我是開發雲端AI 平台給人使用, 然後很多客戶要求一堆的support, 還有一堆鳥問題跟急單, 最好再送sample code, sample or reference model, 最好是可以直接套用, 這樣一家空殼公司, 根本無法處理這些事情 ※ 引述《LDPC (Channel Coding)》之銘言: : 我有在follow coreweave 但是朝另外一個方向 Coreweave現在規劃就是死抱老黃和 : 微軟大腿 他提供的就是第三方租借算力 其他類似的公司有Amazon/Google/Lambda : 然後Coreweave也有跟微軟簽約提供算力 : 老黃這陣子看得出來 他有在朝算力租借這邊佈局 : 在講這些玩家之前 先科普一下如果踏入AI產業 你大概會選擇三個方向其中一個 : AI開發者有大概三個族群 : 1.Train From Scratch (大公司玩家 每年AI頂會三大會 會看到他們出現刷存在感) : 代表產物:BLIP(Saleforce)/CLIP(OpenAI)/DALLE-2(OPENAI)/LLAMA(Meta)/Palm-e(Google) : 2.Fine Tune/Adapter Design: 就是拿上面幾家公司開源的大模型作微調 或者增加套件 : 來整合下游任務 就算是如此也是吃一堆GPU運算 但比上面動輒百顆千顆GPU 小許多 : 3.Deployment (通常是Inference族群) : 開發者就是把模型部署在終端 針對各種特別User Scenario來做優化AI模型 這塊會是 : AMD將來的市場 目前市值估計是1跟2的10倍 需要的人就是做c code和模型轉變(ONNX) : Meta目前也在這佈局 : 在Foundation Model大放異彩後 以及開源平台後Hugging Face興起 : (Hugging Face 這家如果有股票 一定要買爆他) 造成許多優秀AI相關人才 : 包含工程師 都想跳入2跟3的領域 來做面對B2C的AI產業 : 這部分都屬於Foundation Model下游任務 在早期李飛飛ImageNet時代 : 這些特製化面向產業的 以前還可以用GTX/RTX這類遊戲顯卡 去做測試和開發和部署 : 現在你大概得要有V100/A100/H100才行 但這些玩意只有大公司有 : 於是老黃目前看來想幹的就是 解鎖這門檻 讓全世界新創 小型公司 任何優秀人才 : 能加入這產業 在透過Hugging Face 你現在想做LLM 只要套用幾個現成模板 : 你就可以做下游特制化產物 老黃開發了一堆套件諸如AI WorkBench 就像你在用SAAS : Matlab這類軟體 搭個幾個套件 你就可以開發屬於你自己需求下游產物模型 : Pytorch ENG Head也跑去開了一個Firework公司 走這條路 : 原本老黃是寄望雲端三大(Google/MS/Amazon)幫他推租借算力平台 但Amazon已經前後表明 : 他們更希望開發自己的算力平台 而Google/MS隨時都有可能會跳船 那老黃目前感覺就是 : 想養一個親兒子跟他們對幹又或者當替代方案...Coreweaver據傳已經要在德州蓋DGX : Cloud 做開放AI平台和算力租借整合 據理解DGX這類型Cloud就算是上面三大雲玩家也是需要重新蓋機房 : 無法拿以前的infra來升級 因此上面三個玩家也是需要花錢蓋廠 就某種意義 並沒有 : 比Coreweave來的更領先 : 但只要是聰明人都會注意到 這塊租借算力市場的矛盾性 大公司不會希望上面事情發生 : 最糟糕情況就是3這塊會各家公司分走 甚至危機到1這個Training市場 : 也就是老黃不想看到的 挑戰cuda權威 而老黃感覺是要去搶雲市場租借算力這事情 : 讓更多小資本玩家進入這市場 讓他資本做大 更依賴老黃開發工具體系 打破大公司壟斷 : 大模型 進而在算力租借市場開發新的賺錢項目 越多玩家 他就能賣越多鏟子 : 如果老黃成功打造自己的算力租借軟硬整合雲平台(雖然我不看好) 那我會去解鎖我CD帳戶繼續加碼 : 但我也能理解老黃 如果他不這樣幹 他沒辦法持續壟斷這領域 QQ 總之 繼續在旁邊吃瓜 : 看這群大佬互打 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.103.225.6 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1694133645.A.E5A.html

104 則留言

※ 編輯: waitrop (76.103.225.6 美國), 09/08/2023 08:42:35

a12838910, 1F
ai大軍即將抵達

benson01, 2F
CUDA現在就是無可取代呀

jerrychuang, 3F
W大覺得什麼時候會改變這生態呢?

payneblue, 4F
所以你覺得頭頭都不是本科系的就覺得是空殼公司?
你覺得CTO 不是本科系也沒做過任何技術職, 會是一家正常公司? 一個CTO 連代碼都不會寫也看不懂代碼, 甚至連AI 算法與模型都不懂, 你覺得這樣的AI公司很正常?
※ 編輯: waitrop (76.103.225.6 美國), 09/08/2023 08:54:54

zerro7, 5F
感覺你的空殼公司的定義怎麼好像跟市場上不太一樣

tomdavis, 6F
看這家公司在整條利益鏈裡面有沒有分到錢囉

tomdavis, 7F
老黃就學界用了十幾年 跑模型都用CUDA 用習慣了

otaku690, 8F
都有WSJ專訪了刪什麼

ab4daa, 9F
不是法律系 空殼確認

tomdavis, 10F
你真的想推廣就自己發一篇paper比較不同訓練工具

otaku690, 11F
訓練系統精華是mulit-node interconnect

j3024133, 12F
我也越看越覺得扯….這家才兩三億可以買二十幾億的

j3024133, 13F
晶片,然後錢是拿晶片抵押貸款來的,意思就是用NVDA

j3024133, 14F
的晶片抵押貸款去買NVDA的晶片,這邏輯跟FTX當初抵

j3024133, 15F
押自己的代幣去套錢根本一模一樣,有人說Blackrock

j3024133, 16F
的角色是安排公司貸款給Coreweave ,這部分不知道

j3024133, 17F
怎麼查出來的

otaku690, 18F
opencl吃屎吧

tomdavis, 19F
或是用你的工具做個開源的code給大家跑

donkilu, 20F
不是人資吧 CEO之前是做避險基金管理的

donkilu, 21F
CTO資歷跟CEO重疊 大概是從以前跟到現在的親信
抱歉, 眼睛不好看錯, 右眼快瞎了

tomdavis, 22F
沒有長期經營的合作關係 不能天天酸科學家不用你的
open source 跟工具當然有呀! 一堆像是tensorflow, opencl 等等, TPU 搭配tensorflow, 你看有哪幾個科學家願意用, 每個都嫌難用, 不需要合作關係, 是老闆跟下屬關係, 公司要求你用什麼程式語言用什麼工具, 一般員工是不能有意見的, 就算難用也是要學著用, 但是科學家不一樣, 科學家可以跟公司說沒有CUDA 就不會寫代碼, 我遇到好幾次, 我出AI 平台給公司內部科學家, 公司想省錢用自製的TPU 或是ASIC, 公司內部科學家嫌難用, 沒有CUDA不會寫代碼, 我苦口婆心勸用tensorflow, opencl, 還是沒用, 我反而被老闆嫌說花錢開發平台沒人願意用
※ 編輯: waitrop (76.103.225.6 美國), 09/08/2023 09:10:58

min86615, 23F
CUDA 整個生態鍊都起來了,現在有點難被取代

Alwen, 24F
就跟現在顯卡有點像R,其實你拿AMD的卡去跑遊戲 真

Alwen, 25F
的沒差多少

Alwen, 26F
但一堆單子還是指定N卡

tomdavis, 27F
公司內部的話 就跟科學家證明你的比老黃現有的更好

Alwen, 28F
儘管兩邊卡的遊玩體驗真的沒差多少

tomdavis, 29F
跑出來的模型要跟CUDA跑的一樣

donkilu, 30F
也要看perf吧 跑三天才出來 你要怎麼說服使用者用

otaku690, 31F
跑在單一機器都很容易啦 你8台串聯訓練看看

otaku690, 32F
opencl那垃圾driver看看

film12, 33F
照妳的說法,網咖老闆只能是資工系?
不要亂比喻, 拿網咖跟AI 雲端平台比較是很怪的事情, 你做AI 雲端平台全公司沒有任何技術背景, 跟詐騙集團差不多了, 這樣的公司你還敢信

tomdavis, 34F
你這樣就是要從小用iphone的人跳安卓
對, 差不多一樣的意思

Alwen, 35F
之前教主就有說啊 一堆AI大頭手上一堆NV股票,整個

Alwen, 36F
利益集團間接會鞏固老黃那邊的優勢

tomdavis, 37F
本來就是個不只要做出好工具 還要去花時間推廣
因為可以幫公司省很多錢, 效能不輸NVDA, 就是你科學家開發模型會比較麻煩, 但是公司是給薪水的人

film12, 38F
OS很好用,為什麼7成人類用Win?
我到每一家公司都有規定要用特定的OS, 跟特定的工具+程式語言, 不是自己可以決定的, 我們在說的是工作上的事, 牽涉到公司利益與成本, 我工作20年, 大部分公司都是用Linux, 除了微軟用Win

Alwen, 39F
老黃真的很像iphone水果行,安卓說真的也不是不能

strlen, 106F
了公司要省錢我們去光華弄一台兩萬塊的桌機我幫你搞

strlen, 107F
黑蘋開發環境一樣 你看哪個工程師不會爆炸

tomdavis, 108F
會爆炸的是 iOS工程師 組電腦的想說明明省錢效能好

cosmo7897, 109F
科學家變成炒股大戶了 難怪科技進展那麼慢