※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Stock
標題

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」

最新2024-04-11 07:22:00
留言31則留言,20人參與討論
推噓18 ( 19111 )
原文恕刪 小弟剛好最近有跟到一些台灣LLM的發展,可以補充一下關於模型的部分。聯發科的研究 單位聯發創新基地,做語言模型有一段時間了,之前有一版Breeze-7B模型,發佈了一篇 技術論文放在arxiv: https://arxiv.org/pdf/2403.02712.pdf 論文提到這個模型是從mistral-7B 繼續訓練而成,花了7000小時的H100,灌了650GB的da ta。如果有一半是中文,325GB,也灌了超過1000億漢字(3bytes=1word),其實很多了啦 。 然後Breexe是從Mixtral訓練而成,是更大一級的模型,論文好像還沒出,但很多公司都 有不同大小的模型,做法應該不會差太多(?)。最近有開放API試用: https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1 跟ChatGPT的比較,最重要的點應該是,像Breeze-7B這種已經開源的模型,對能架伺服器 的公司來說,是用越多越賺;跟token收費的ChatGPT 用越多越貴截然不同。Breexe不知 道會不會開源就是了。 達哥的部分,沒有親自用過,但有認識的人用過。基本上就是平台,然後有一些功能,像 是讀pdf等等。就把AI推廣給更多人的東西,應該是不錯啦。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.35.85 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1712752740.A.F57.html

Re: 回文串

31 則留言

stlinman, 1F
開源的 Breeze-7B 我是玩一下過,感覺還不錯!

stlinman, 2F

tomdavis, 3F
推介紹!

addy7533967, 4F
推推

xm3u4vmp6, 5F
一看到h100 直接冷掉 一半人根本玩不起QQ

Sixigma, 6F
做隔壁專業的,好奇這樣子也會有 emerging ability

Sixigma, 7F
嗎,其實它變單一語種而且是繁中,和原始模型不能算

Sixigma, 8F
同個東西了吧,而且英語的普及度又遠大於繁中,很多

Sixigma, 9F
問題會受限吧,那個benchmark和GPT3.5也差一截

damn1120, 10F
可以幫文組翻譯嗎 救命-.-

stlinman, 11F
重點是企業設置私有AI模型運用,要能合規法循。所以

stlinman, 12F
繁中未來還是有一定的市場可以開發。

turndown4wat, 13F
這樣發哥明天是漲還是跌?

avali, 14F
聯發哥2000

Morphee, 15F
這東西開發跟上好處很多 值得值得

Morphee, 16F
受限沒關係啊 跟上就好

bj45566, 17F
Mistral AI 這家法國新創有前途啊,微軟都要琵琶別

bj45566, 18F
抱了

bj45566, 19F
發哥有眼光

napyang, 20F
個人覺得繁體中文最強的開源就是breeze 7B了,回答

napyang, 21F
的都滿好的。

fukku100, 22F
特點除了繁體,可以針對臺灣的內容回答得不錯

Isopod, 23F
達哥也不是功能啦,大部分就是挑好model然後寫好pro

Isopod, 24F
mpt來做各種事情

coffee112, 25F
推推

Ken52039, 26F
未來股王

stevegood, 27F
講實話工作上能用很不錯

wayne0530, 28F
繁中最大資料庫,是否能用ptt內的文章來灌進去訓練

Surrey00, 29F
推推

qwe78971, 30F
果然是拿開源拿來改== 給我一台H100 我也行

greatwu, 31F
聞西,要你命3000,訊號來了