※ 本文轉寄自 ptt.cc, 文章原始頁面

看板Gossiping

標題

Re: [爆卦] 中央研究院詞庫小組大型語言模型

時間2023-10-09 20:40:01

留言78則留言，38人參與討論

推噓-6 ( 13推19噓46→ )

回文12則回文

※ 引述《dean1990 (狄恩院長)》之銘言： : 本魯也很好奇問了一些問題， : 首先是比較基礎的： : https://i.imgur.com/zKhx1A2.jpg

: 接著是大家都知道的： : https://i.imgur.com/Tl8GRO3.jpg

: 再來是比較敏感一點的： : https://i.imgur.com/Xm7bZC3.jpg

: 最後倒是令本魯比較意外： : https://i.imgur.com/d43AJ24.jpg

: 中研院作為我國最高研究機構， : 研究結論應該還算有公信力吧。 : ※ 引述《PekoraSakura (PekoMiko)》之銘言： : : https://huggingface.co/spaces/ckiplab/CKIP-Llama-2-7b-chat : : 不知道這研究案領多少錢? : : https://i.imgur.com/tt7aKBR.jpg

: : https://i.imgur.com/SpiGuTr.jpg

: : https://i.imgur.com/kXrHsS1.jpg

: : 拿別人的成功來tune一下就可以掛名中研院...... : : 有沒有掛? 對於LLM只有這一點認知程度的話，最好不要就這樣出來帶風向會比較好，不然先去跟陽明交大校長先去旁邊先學習一下什麼叫做LLM，不同LLM之間又有什麼差異。第一個錯誤的認知是認為LLM就應該要提供正確的答案，事實上LLM是一個機率模型，它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個，它不是資料庫，所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。第二個錯誤的認知是把所有的LLM都當成是同一個等級，好像只要A不如B那A就不行，是垃圾。以這個案例來說，它是Llama-2-7b跟Atom-7b模型，前面的Llama-2模型是代表它是META出的Llama模型第二代(可商用)，而7b則是說它的參數是70億個，不要以為70億個參數很多，70億參數以LLM來說只能說是非常小的，所以答出一切亂七八糟的答案非常正常，在7b之上，還有13b跟70b的模型參數量。 7b的模型實務上如果沒有經過finetune然後針對小範圍的特定任務，基本上就是玩具而已。第三，就是對於台灣的能力有誤會，做AI大概分為三個要素，模型/資料/算力。在大語言模型方面，台灣三個都弱，模型用開源的即便是台智雲，也是用開源模型。資料方面，繁體中文本來就在中文領域本來就是弱項(中文已經很弱了，繁體中文更弱)，算力方面，台灣有算力從頭到尾訓練LLM的不是說沒有，但跟OpenAI, META都還是非常非常遙遠的距離，所以能做作finetune就不錯了。這是原生llama-2的試玩網址(記得把模型調到7b來比較) https://www.llama2.ai/ 好，回歸重點，中研院在網站上就已經說過了 #### 以商用開源模型Llama-2-7b以及Atom-7b為基礎，再補強繁體中文的處理能力 #### 好，剛剛我說了Llam2-2-7b，那Atom-7b我剛剛沒有提到，這是什麼東西? Atom-7b就是https://github.com/FlagAlpha/Llama2-Chinese 這個就是中國訓練出來的大語言模型，Atom-7b 中研院從頭到尾都沒有隱藏這件事，它就是基於中國訓練的Atom-7b然後再用繁體中文去 finetune出來的模型啊。從頭到尾中研院就沒有隱藏這件事，完全不知道前面好像發現什麼新大陸一樣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.19.98 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696826405.A.8BC.html

Re: 回文串

230393

[爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 10:09

312

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 10:14

715

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 10:24

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 10:50

-678

> Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 12:40

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 12:42

617

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 13:05

2241

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 13:30

116

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 14:17

-17

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 15:41

212

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 20:07

2358

Re: [爆卦] 中央研究院詞庫小組大型語言模型

Gossiping10/09 20:20

78 則留言

推

Aotearoa10/09 12:40, 1F

只是要酸民進黨而已啦61.58.110.137

→

spzper10/09 12:41, 2F

笑死，如果KMT搞這種早嘴爆1.170.66.19

※ 編輯: derekhsu (175.182.19.98 臺灣), 10/09/2023 12:42:38

噓

gaymay556610/09 12:43, 3F

所以這種垃圾東西可以給台灣人用嗎？36.234.77.82

噓

keydata10/09 12:43, 4F

喔，那請把中國寫上去，不要只寫模型的英223.137.198.67

→

keydata10/09 12:43, 5F

文名啊223.137.198.67

噓

alcpeon91110/09 12:44, 6F

這時候就沒有抗中保台的問題了☺223.136.234.220

推

wmud10/09 12:45, 7F

基本上你的第一點就是讓很多酸民發現新大陸42.73.53.216

→

wmud10/09 12:45, 8F

的點，八卦一堆中老年酸民當初沒玩過chatg42.73.53.216

推

snocia10/09 12:45, 9F

標題把中國兩個中文字寫出來就給過180.217.76.226

→

wmud10/09 12:45, 10F

pt還真的以為AI模型的回答有指向性或是必定42.73.53.216

→

wmud10/09 12:45, 11F

正確不會唬爛42.73.53.216

噓

keydata10/09 12:45, 12F

只寫模型的名稱不敢寫中國兩個字，然後整223.137.198.67

→

keydata10/09 12:45, 13F

天抗中飽台223.137.198.67

→

keydata10/09 12:46, 14F

被抓包再來說，那個模型名稱去查就是中國223.137.198.67

→

keydata10/09 12:46, 15F

訓練的，我們沒隱瞞啊223.137.198.67

→

su4vu610/09 12:46, 16F

沒辦法他們又不在乎真相只是想帶風向118.232.104.122

→

snocia10/09 12:47, 17F

然後最好再加上本模型回答以中華人民共和180.217.76.226

→

snocia10/09 12:47, 18F

國資料為主要參考對象，不然回答一律當成180.217.76.226

→

snocia10/09 12:47, 19F

民主進步黨的定調180.217.76.226

推

lianpig556610/09 12:48, 20F

你在八卦板認真啥它們只是找理由酸125.229.142.121

噓

yesonline10/09 12:48, 21F

感謝政府感謝黨, 釋出繁中化的模型...220.133.253.85

→

lianpig556610/09 12:48, 22F

執政黨而已125.229.142.121

噓

iopzu3lv010/09 12:48, 23F

領一堆錢然後拿他國模組交差了事好棒122.121.227.138

→

iopzu3lv010/09 12:49, 24F

一堆米蟲難怪停滯20年122.121.227.138

噓

Beltran10/09 12:50, 25F

塔綠假日點名49.215.46.48

推

SpectreMan10/09 12:50, 26F

沒有問題幹嘛下架？我剛玩得正爽49.158.78.6

噓

Yahweh10/09 12:50, 27F

要這樣找兩個研究生就能搞找你中研院幹麻118.169.145.38

→

xdbx10/09 12:51, 28F

那它答案怎麼變那麼快是想洗掉什麼36.237.188.88

推

wamng10/09 12:57, 29F

按照民進黨的標準，中研院應該被扣帽子了，103.238.130.134

→

wamng10/09 12:57, 30F

關鍵不是鄉民怎麼看，是民進黨雙標103.238.130.134

噓

KCSonfire10/09 12:57, 31F

我只想提出一個問題？所以處處防中國180.217.28.161

→

KCSonfire10/09 12:57, 32F

防假的？這裡忽然又可以了？180.217.28.161

推

wamng10/09 12:59, 33F

連用APP都要扣帽子，這種AI底層架構可以？103.238.130.132

→

wamng10/09 12:59, 34F

民進黨要不要臉103.238.130.132

→

derekhsu10/09 12:59, 35F

做不出來啊怎麼辦呢？沒算力沒資料沒175.182.169.199

→

derekhsu10/09 12:59, 36F

模型175.182.169.199

→

widec10/09 13:01, 37F

同意KCSonfire1.165.42.242

噓

cloudyoyo10/09 13:01, 38F

那怎不大方說我們中研院用中國模型？111.240.216.110

→

widec10/09 13:02, 39F

做不出來就抄中國的這很雙標1.165.42.242

推

xm3u4vmp610/09 13:45, 67F

養老機構你要他怎樣？真的超屌都去美111.82.211.65

→

xm3u4vmp610/09 13:45, 68F

國了111.82.211.65

→

speedythief10/09 13:54, 69F

綠色=>我們是不得已的！其他顏色=>220.142.96.48

→

speedythief10/09 13:54, 70F

噁心賣國賊！220.142.96.48

→

yeangigi10/09 14:24, 71F

=== 哥布林：你說什麼我看不懂啦 ===36.225.6.148

噓

historyway10/09 14:42, 72F

這是中研院，標準不要降這麼低36.232.51.105

→

historyway10/09 14:42, 73F

這種辯護方式，讓我覺得可恥和可憐36.232.51.105

噓

LPCbaimlly10/09 14:54, 74F

所以就外包再外包嘛，繁體化這件事什42.72.62.136

→

LPCbaimlly10/09 14:54, 75F

麼時候需要動用到國家級研究機構了42.72.62.136

噓

s90052710/09 15:17, 76F

低能綠共整天賣國61.227.225.131

→

bbs084073810/09 16:12, 77F

翻譯：台灣就是沒東西可用只好用中國101.139.237.255

噓

lunatich10/09 17:30, 78F

沒隱藏就沒事喔？所以中研院是資敵賣台101.10.44.253

→

lunatich10/09 17:30, 79F

嗎？101.10.44.253

derekhsu 作者的近期文章

128Gossiping

Re: [問卦] 3000萬粉絲網紅-貓一杯遭全網封禁

-1Gossiping

Re: [新聞] 聯合國壓倒性多數要「以哈停火」以色列

※ 引述《anti87 (00)》之銘言： : 2023.10.28 08:21台視責任編輯／林均 : https://news.ttv.com.tw/news/11210280000200W : 聯合國壓倒性多數要「以哈停火」以色列怒斥

1Gossiping

Re: [爆卦] 中央研究院詞庫小組大型語言模型

15Gossiping

Re: [問卦] 張三豐自己的徒弟怎麼都廢物？

※ 引述《alexhsu0909 (MazdaNo1)》之銘言： : 先是被滅絕一劍滅了的張翠山 : 人家小昭還可以擋三掌 : 再來是被阿貓阿狗斷筋骨的殷六俠 : 師兄弟全被朝廷抓走 : 最後還被當走狗的宋青書暗算 : 怎麼張三豐自己的徒弟

4Gossiping

Re: [問卦] 網路言論幾乎全部都支持老闆的原因？

14Gossiping

Re: [問卦] 當年范瑋琪和張韶涵為什麼翻臉？

6Gossiping

Re: [爆卦] 瘦子!!??

9Gossiping

Re: [問卦] Me too 之 NONO厲害多了

9Gossiping

[問卦] 如果炎P事件主角是16歲少女風向會不同嗎

更多 derekhsu 作者的文章...