※ 本文轉寄自 ptt.cc, 文章原始頁面

看板Gossiping

作者afking (掛網中)

標題

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

時間2023-10-09 19:05:45

最新2023-10-09 19:37:00

留言68則留言，8人參與討論

推噓-1 ( 4推5噓59→ )

回文7則回文

※ 引述《messi5566 (虹粉)》之銘言： : 中研院最近發布了他們自己開發的LLM : 說是在處理繁體中文的任務上表現優異 : 可是小妹看了一下跑出來的成果 : https://i.imgur.com/I1zNnIa.png

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

: https://i.imgur.com/BJIxJY6.png

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

: 請問繁體中文的任務內容是把簡體翻譯過來嗎 : 詳細資料在這裡 : https://huggingface.co/spaces/ckiplab/CKIP-Llama-2-7b-chat 這語言模型基礎是建構於Llama 2，meta提供的開源模型另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型，也是開源且開放商用技術上也不用解釋太多，反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某些爭議性回答如果你想獲得一個相反的答案，只要多試幾次調一下參數就行，像這樣 https://i.imgur.com/GQlNhZj.jpg

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

然後一群人就高潮了某種程度上AI真的恐怖，尤其是在知識落後地域 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.61.199 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696820747.A.ACC.html

Re: 回文串

152276

[問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 02:28

49103

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 02:50

-168

> Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 11:05

45

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 13:23

-417

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 13:40

55110

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 14:34

-13

Re: [問卦] 中研院自己做的大型語言模型怎麼了？

Gossiping10/09 15:20

68 則留言

→

fantasyth10/09 11:07, 1F

所以原來是meta開發的喔162.120.132.197

→

la8day10/09 11:14, 2F

但你真的覺得這樣算有做得好，達成中研院27.53.170.245

→

la8day10/09 11:14, 3F

本來的目的嗎…27.53.170.245

推

Xaymaca10/09 11:16, 4F

日本已經發聲需要訓練ai正確的價值觀206.116.133.147

→

afking10/09 11:17, 5F

看你的目的是啥，本來也就沒足夠資料從頭1.171.61.199

→

afking10/09 11:17, 6F

建造一個可能是垃圾的模型，而審查這塊不1.171.61.199

→

afking10/09 11:17, 7F

就台灣人最討厭的1.171.61.199

→

froce10/09 11:18, 8F

耶，架構來自meta，模型來自中國開源…36.233.192.148

→

froce10/09 11:18, 9F

那至少要先微調到讓人看不出手腳吧？要不36.233.192.148

→

froce10/09 11:18, 10F

然誰知道中研院做了什麼？36.233.192.148

→

yesonline10/09 11:21, 11F

北京海天瑞聲科技220.133.253.85

→

afking10/09 11:22, 12F

你要做手腳到回答正確國家價值的程度，那1.171.61.199

→

afking10/09 11:22, 13F

叫做國家機器，不叫做機器學習了1.171.61.199

→

froce10/09 11:36, 14F

啊你模型也不是自己的，架構也不是自己的36.233.192.148

→

froce10/09 11:36, 15F

，學習什麼？36.233.192.148

→

froce10/09 11:38, 16F

這就跟上次疫苗網站裡有簡中註釋一樣，要36.233.192.148

→

froce10/09 11:38, 17F

抄可以，把破綻弄掉誰也不知道36.233.192.148

→

afking10/09 11:44, 18F

你搞錯了，從頭到尾都是模型，簡單而言就49.216.48.168

→

afking10/09 11:44, 19F

是把開源模型調教成適合繁中使用者的模型49.216.48.168

→

froce10/09 11:47, 20F

啊現在不就是你模型沒調成適合繁中的狀況36.233.192.148

→

froce10/09 11:47, 21F

，開放介面給人玩，才被吐槽嗎？36.233.192.148

→

afking10/09 11:47, 22F

因為就算你把全ptt的文本從頭開始練都達不49.216.48.168

→

afking10/09 11:47, 23F

到LLM需要的數量，也非常燒錢49.216.48.168

→

afking10/09 11:49, 24F

如果你覺得要回答有特定價值觀的模型才有49.216.48.168

→

afking10/09 11:50, 25F

意義，那你應該適合文心一言而不是這種49.216.48.168

推

la8day10/09 11:52, 26F

事實上，台灣人可能比較期待後者27.53.170.245

→

la8day10/09 11:54, 27F

這不只是意識形態的問題，目前實用方面會27.53.170.245

→

la8day10/09 11:54, 28F

被認為是不可用27.53.170.245

推

Gwdz10/09 12:05, 29F

就不要講是自己研發的就好了，finetune說自27.247.68.90

→

Gwdz10/09 12:05, 30F

己做的被罵合理吧27.247.68.90

推

franktpmvu10/09 12:08, 31F

就資料沒洗乾淨而已223.137.74.69

→

afking10/09 12:18, 32F

我點進去上面都有說明啊...還中文49.216.48.168

噓

froce10/09 12:27, 33F

又來了，說不過就開始嘴人中共同路人，這36.233.192.148

→

froce10/09 12:27, 34F

種人才適合文言一心吧？科科36.233.192.148

噓

Gwdz10/09 12:35, 35F

你的中文字典沒有開發兩個字嗎，第一句話就27.247.68.90

→

Gwdz10/09 12:35, 36F

說自己開發的，你要幹別人的架構然後finetun27.247.68.90

→

Gwdz10/09 12:35, 37F

e,不如說是應用吧，開發了啥網頁開發嗎27.247.68.90

→

afking10/09 14:29, 38F

文心一言是目前中文文本裡最好的大型語言1.171.61.199

→

afking10/09 14:29, 39F

模型啊，又抹中共同路人了1.171.61.199

→

Gwdz10/09 18:38, 55F

一點尊重好嗎，這樣以後誰還要開源給別人用27.247.68.90

→

Gwdz10/09 18:38, 56F

，換個皮就說是自己開發的，你真的認為這樣27.247.68.90

→

Gwdz10/09 18:38, 57F

可以啊？雖然不犯法啦，但我覺得不好看啦，27.247.68.90

→

Gwdz10/09 18:38, 58F

難怪台灣軟體業都這樣覺得開發就是git clone27.247.68.90

→

Gwdz10/09 18:38, 59F

就好27.247.68.90

噓

Gwdz10/09 19:31, 60F

開發跟可商用就像，你讓大學同學們抄你的作27.247.68.90

→

Gwdz10/09 19:31, 61F

業，然後其中一個同學抄完後作業然後跟別人27.247.68.90

→

Gwdz10/09 19:31, 62F

說，可以抄我的，雖然我有參考其他人的啦但27.247.68.90

→

Gwdz10/09 19:31, 63F

是這是我修改過後的版本，然後發現修改是把27.247.68.90

→

Gwdz10/09 19:31, 64F

你字體改變而已，抄完答案閉嘴(不可商用)不27.247.68.90

→

Gwdz10/09 19:31, 65F

給別人抄根本沒人管你好嗎27.247.68.90

→

la8day10/09 19:36, 66F

事實上就是不能用27.53.170.245

→

la8day10/09 19:37, 67F

llama本體足夠強大這案子經費只有30萬27.53.170.245

→

la8day10/09 19:37, 68F

還把它tune的更糟27.53.170.245

afking 作者的近期文章

Re: [新聞] 「蔣萬安說要7點半上班只撐5天」　柯文哲

我比較好奇，大家真心普遍覺得7點半上班會比較認真嗎？個人是6點半起來通勤一個小時進公司那種但主要是為了避開尖峰時間跟早點下班，也沒有多拼的想法上面中老年的主管確實多少會覺得，早上班晚下班是態度的展現反之同輩的就經常嫌公司彈性上下班還

更多 afking 作者的文章...