※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

Re: [爆卦] 中央研究院詞庫小組大型語言模型

留言78則留言,38人參與討論
推噓-6 ( 131946 )
※ 引述《dean1990 (狄恩院長)》之銘言: : 本魯也很好奇問了一些問題, : 首先是比較基礎的: : https://i.imgur.com/zKhx1A2.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: 接著是大家都知道的: : https://i.imgur.com/Tl8GRO3.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: 再來是比較敏感一點的: : https://i.imgur.com/Xm7bZC3.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: 最後倒是令本魯比較意外: : https://i.imgur.com/d43AJ24.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: 中研院作為我國最高研究機構, : 研究結論應該還算有公信力吧。 : ※ 引述《PekoraSakura (PekoMiko)》之銘言: : : https://huggingface.co/spaces/ckiplab/CKIP-Llama-2-7b-chat : : 不知道這研究案領多少錢? : : https://i.imgur.com/tt7aKBR.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: : https://i.imgur.com/SpiGuTr.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: : https://i.imgur.com/kXrHsS1.jpg
Re: [爆卦] 中央研究院詞庫小組大型語言模型
: : 拿別人的成功來tune一下就可以掛名中研院...... : : 有沒有掛? 對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。 第二個錯誤的認知是把所有的LLM都當成是同一個等級,好像只要A不如B那A就不行,是 垃圾。以這個案例來說,它是Llama-2-7b跟Atom-7b模型,前面的Llama-2模型是代表它 是META出的Llama模型第二代(可商用),而7b則是說它的參數是70億個,不要以為70億 個參數很多,70億參數以LLM來說只能說是非常小的,所以答出一切亂七八糟的答案非 常正常,在7b之上,還有13b跟70b的模型參數量。 7b的模型實務上如果沒有經過finetune然後針對小範圍的特定任務,基本上就是玩具而 已。 第三,就是對於台灣的能力有誤會,做AI大概分為三個要素,模型/資料/算力。在大語言 模型方面,台灣三個都弱,模型用開源的即便是台智雲,也是用開源模型。資料方面, 繁體中文本來就在中文領域本來就是弱項(中文已經很弱了,繁體中文更弱),算力方面, 台灣有算力從頭到尾訓練LLM的不是說沒有,但跟OpenAI, META都還是非常非常遙遠的距離 ,所以能做作finetune就不錯了。 這是原生llama-2的試玩網址(記得把模型調到7b來比較) https://www.llama2.ai/ 好,回歸重點,中研院在網站上就已經說過了 #### 以商用開源模型Llama-2-7b以及Atom-7b為基礎,再補強繁體中文的處理能力 #### 好,剛剛我說了Llam2-2-7b,那Atom-7b我剛剛沒有提到,這是什麼東西? Atom-7b就是https://github.com/FlagAlpha/Llama2-Chinese 這個就是中國訓練出來的大語言模型,Atom-7b 中研院從頭到尾都沒有隱藏這件事,它就是基於中國訓練的Atom-7b然後再用繁體中文去 finetune出來的模型啊。 從頭到尾中研院就沒有隱藏這件事,完全不知道前面好像發現什麼新大陸一樣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.19.98 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696826405.A.8BC.html

78 則留言

Aotearoa, 1F
只是要酸民進黨而已啦61.58.110.137

spzper, 2F
笑死,如果KMT搞這種早嘴爆1.170.66.19
※ 編輯: derekhsu (175.182.19.98 臺灣), 10/09/2023 12:42:38

gaymay5566, 3F
所以這種垃圾東西可以給台灣人用嗎?36.234.77.82

keydata, 4F
喔,那請把中國寫上去,不要只寫模型的英223.137.198.67

keydata, 5F
文名啊223.137.198.67

alcpeon911, 6F
這時候就沒有抗中保台的問題了☺223.136.234.220

wmud, 7F
基本上你的第一點就是讓很多酸民發現新大陸42.73.53.216

wmud, 8F
的點,八卦一堆中老年酸民當初沒玩過chatg42.73.53.216

snocia, 9F
標題把中國兩個中文字寫出來就給過180.217.76.226

wmud, 10F
pt還真的以為AI模型的回答有指向性或是必定42.73.53.216

wmud, 11F
正確不會唬爛42.73.53.216

keydata, 12F
只寫模型的名稱不敢寫中國兩個字,然後整223.137.198.67

keydata, 13F
天抗中飽台223.137.198.67

keydata, 14F
被抓包再來說,那個模型名稱去查就是中國223.137.198.67

keydata, 15F
訓練的,我們沒隱瞞啊223.137.198.67

su4vu6, 16F
沒辦法 他們又不在乎真相 只是想帶風向118.232.104.122

snocia, 17F
然後最好再加上本模型回答以中華人民共和180.217.76.226

snocia, 18F
國資料為主要參考對象,不然回答一律當成180.217.76.226

snocia, 19F
民主進步黨的定調180.217.76.226

lianpig5566, 20F
你在八卦板認真啥 它們只是找理由酸125.229.142.121

yesonline, 21F
感謝政府感謝黨, 釋出繁中化的模型...220.133.253.85

lianpig5566, 22F
執政黨而已125.229.142.121

iopzu3lv0, 23F
領一堆錢然後拿他國模組交差了事 好棒122.121.227.138

iopzu3lv0, 24F
一堆米蟲難怪停滯20年122.121.227.138

Beltran, 25F
塔綠假日點名49.215.46.48

SpectreMan, 26F
沒有問題幹嘛下架?我剛玩得正爽49.158.78.6

Yahweh, 27F
要這樣找兩個研究生就能搞找你中研院幹麻118.169.145.38

xdbx, 28F
那它答案怎麼變那麼快 是想洗掉什麼36.237.188.88

wamng, 29F
按照民進黨的標準,中研院應該被扣帽子了,103.238.130.134

wamng, 30F
關鍵不是鄉民怎麼看,是民進黨雙標103.238.130.134

KCSonfire, 31F
我只想提出一個問題?所以處處防中國180.217.28.161

KCSonfire, 32F
防假的?這裡忽然又可以了?180.217.28.161

wamng, 33F
連用APP都要扣帽子,這種AI底層架構可以?103.238.130.132

wamng, 34F
民進黨要不要臉103.238.130.132

derekhsu, 35F
做不出來啊 怎麼辦呢? 沒算力沒資料沒175.182.169.199

derekhsu, 36F
模型175.182.169.199

widec, 37F
同意KCSonfire1.165.42.242

cloudyoyo, 38F
那怎不大方說我們中研院用中國模型?111.240.216.110

widec, 39F
做不出來就抄中國的 這很雙標1.165.42.242

xm3u4vmp6, 67F
養老機構你要他怎樣?真的超屌都去美111.82.211.65

xm3u4vmp6, 68F
國了111.82.211.65

speedythief, 69F
綠色=>我們是不得已的!其他顏色=>220.142.96.48

speedythief, 70F
噁心賣國賊!220.142.96.48

yeangigi, 71F
=== 哥布林:你說什麼我看不懂啦 ===36.225.6.148

historyway, 72F
這是中研院,標準不要降這麼低36.232.51.105

historyway, 73F
這種辯護方式,讓我覺得可恥和可憐36.232.51.105

LPCbaimlly, 74F
所以就外包再外包嘛,繁體化這件事什42.72.62.136

LPCbaimlly, 75F
麼時候需要動用到國家級研究機構了42.72.62.136

s900527, 76F
低能綠共整天賣國61.227.225.131

bbs0840738, 77F
翻譯:台灣就是沒東西可用只好用中國101.139.237.255

lunatich, 78F
沒隱藏就沒事喔?所以中研院是資敵賣台101.10.44.253

lunatich, 79F
嗎?101.10.44.253

derekhsu 作者的近期文章

Re: [新聞] 聯合國壓倒性多數要「以哈停火」 以色列
※ 引述《anti87 (00)》之銘言: : 2023.10.28 08:21台視責任編輯/林均 : https://news.ttv.com.tw/news/11210280000200W : 聯合國壓倒性多數要「以哈停火」 以色列怒斥
Re: [問卦] 張三豐自己的徒弟怎麼都廢物?
※ 引述《alexhsu0909 (MazdaNo1)》之銘言: : 先是被滅絕一劍滅了的張翠山 : 人家小昭還可以擋三掌 : 再來是被阿貓阿狗斷筋骨的殷六俠 : 師兄弟全被朝廷抓走 : 最後還被當走狗的宋青書暗算 : 怎麼張三豐自己的徒弟
更多 derekhsu 作者的文章...