※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

Re: [問卦] 中研院自己做的大型語言模型怎麼了?

最新2023-10-09 19:37:00
留言68則留言,8人參與討論
推噓-1 ( 4559 )
※ 引述《messi5566 (虹粉)》之銘言: : 中研院最近發布了他們自己開發的LLM : 說是在處理繁體中文的任務上表現優異 : 可是小妹看了一下跑出來的成果 : https://i.imgur.com/I1zNnIa.png
Re: [問卦] 中研院自己做的大型語言模型怎麼了?
: https://i.imgur.com/BJIxJY6.png
Re: [問卦] 中研院自己做的大型語言模型怎麼了?
: 請問繁體中文的任務內容是把簡體翻譯過來嗎 : 詳細資料在這裡 : https://huggingface.co/spaces/ckiplab/CKIP-Llama-2-7b-chat 這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答 如果你想獲得一個相反的答案,只要多試幾次調一下參數就行,像這樣 https://i.imgur.com/GQlNhZj.jpg
Re: [問卦] 中研院自己做的大型語言模型怎麼了?
然後一群人就高潮了 某種程度上AI真的恐怖,尤其是在知識落後地域 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.61.199 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696820747.A.ACC.html

68 則留言

fantasyth, 1F
所以原來是meta開發的喔162.120.132.197

la8day, 2F
但你真的覺得這樣算有做得好,達成中研院27.53.170.245

la8day, 3F
本來的目的嗎…27.53.170.245

Xaymaca, 4F
日本已經發聲需要訓練ai正確的價值觀206.116.133.147

afking, 5F
看你的目的是啥,本來也就沒足夠資料從頭1.171.61.199

afking, 6F
建造一個可能是垃圾的模型,而審查這塊不1.171.61.199

afking, 7F
就台灣人最討厭的1.171.61.199

froce, 8F
耶,架構來自meta,模型來自中國開源…36.233.192.148

froce, 9F
那至少要先微調到讓人看不出手腳吧?要不36.233.192.148

froce, 10F
然誰知道中研院做了什麼?36.233.192.148

yesonline, 11F
北京海天瑞聲科技220.133.253.85

afking, 12F
你要做手腳到回答正確國家價值的程度,那1.171.61.199

afking, 13F
叫做國家機器,不叫做機器學習了1.171.61.199

froce, 14F
啊你模型也不是自己的,架構也不是自己的36.233.192.148

froce, 15F
,學習什麼?36.233.192.148

froce, 16F
這就跟上次疫苗網站裡有簡中註釋一樣,要36.233.192.148

froce, 17F
抄可以,把破綻弄掉誰也不知道36.233.192.148

afking, 18F
你搞錯了,從頭到尾都是模型,簡單而言就49.216.48.168

afking, 19F
是把開源模型調教成適合繁中使用者的模型49.216.48.168

froce, 20F
啊現在不就是你模型沒調成適合繁中的狀況36.233.192.148

froce, 21F
,開放介面給人玩,才被吐槽嗎?36.233.192.148

afking, 22F
因為就算你把全ptt的文本從頭開始練都達不49.216.48.168

afking, 23F
到LLM需要的數量,也非常燒錢49.216.48.168

afking, 24F
如果你覺得要回答有特定價值觀的模型才有49.216.48.168

afking, 25F
意義,那你應該適合文心一言而不是這種49.216.48.168

la8day, 26F
事實上,台灣人可能比較期待後者27.53.170.245

la8day, 27F
這不只是意識形態的問題,目前實用方面會27.53.170.245

la8day, 28F
被認為是不可用27.53.170.245

Gwdz, 29F
就不要講是自己研發的就好了,finetune說自27.247.68.90

Gwdz, 30F
己做的被罵合理吧27.247.68.90

franktpmvu, 31F
就資料沒洗乾淨而已223.137.74.69

afking, 32F
我點進去上面都有說明啊...還中文49.216.48.168

froce, 33F
又來了,說不過就開始嘴人中共同路人,這36.233.192.148

froce, 34F
種人才適合文言一心吧?科科36.233.192.148

Gwdz, 35F
你的中文字典沒有開發兩個字嗎,第一句話就27.247.68.90

Gwdz, 36F
說自己開發的,你要幹別人的架構然後finetun27.247.68.90

Gwdz, 37F
e,不如說是應用吧,開發了啥網頁開發嗎27.247.68.90

afking, 38F
文心一言是目前中文文本裡最好的大型語言1.171.61.199

afking, 39F
模型啊,又抹中共同路人了1.171.61.199

Gwdz, 55F
一點尊重好嗎,這樣以後誰還要開源給別人用27.247.68.90

Gwdz, 56F
,換個皮就說是自己開發的,你真的認為這樣27.247.68.90

Gwdz, 57F
可以啊?雖然不犯法啦,但我覺得不好看啦,27.247.68.90

Gwdz, 58F
難怪台灣軟體業都這樣覺得開發就是git clone27.247.68.90

Gwdz, 59F
就好27.247.68.90

Gwdz, 60F
開發跟可商用就像,你讓大學同學們抄你的作27.247.68.90

Gwdz, 61F
業,然後其中一個同學抄完後作業然後跟別人27.247.68.90

Gwdz, 62F
說,可以抄我的,雖然我有參考其他人的啦但27.247.68.90

Gwdz, 63F
是這是我修改過後的版本,然後發現修改是把27.247.68.90

Gwdz, 64F
你字體改變而已,抄完答案閉嘴(不可商用)不27.247.68.90

Gwdz, 65F
給別人抄根本沒人管你好嗎27.247.68.90

la8day, 66F
事實上就是不能用27.53.170.245

la8day, 67F
llama本體足夠強大 這案子經費只有30萬27.53.170.245

la8day, 68F
還把它tune的更糟27.53.170.245

afking 作者的近期文章

Re: [新聞] 「蔣萬安說要7點半上班只撐5天」 柯文哲
我比較好奇,大家真心普遍覺得7點半上班會比較認真嗎? 個人是6點半起來通勤一個小時進公司那種 但主要是為了避開尖峰時間跟早點下班,也沒有多拼的想法 上面中老年的主管確實多少會覺得,早上班晚下班是態度的展現 反之同輩的就經常嫌公司彈性上下班還
更多 afking 作者的文章...