※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

Re: [爆卦] 中央研究院詞庫小組大型語言模型

最新2023-10-10 13:37:00
留言58則留言,31人參與討論
推噓23 ( 25231 )
: 至於說,CKIP可以辯解說,我們確實沒有隱瞞也確實提升了繁中能力,那我認真覺得如果 : 我們只是希望模型輸出全繁中而不在意希望模型學會繁中文化跟台灣環境的流行用語的話 : ,那我們直接拿英文數據做機翻不是更快更有效?!英文數據還取之不盡,英文to繁中的 : 翻譯模型開源的現在也一大堆,翻譯品質也算堪用。 : 而且真的要做這件事情也不用中研院來做。阿肥我直接業餘一個禮拜直接搞定,阿肥之前 : 也訓練過一堆這種tune壞的Garbage LLM,現在訓練接微軟的deepspeed又快又無腦,Nvid : ia最近也釋出自己的訓練框架,config調一調我連code都不用自己寫,現在一張4090就可 : 以tune起來7b模型了,幹嘛要你中研院來做?! : 而且tune壞的部分我要finetune還要加數據把他tune回來,那我直接拿Atom 7b原生做就 : 好了啊! : 唉~ 阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~ https://reurl.cc/QZer9M 本院資訊所表示,CKIP-LlaMa-2-7b 並非「臺版chatGPT」,且跟國科會正在發展的 TAIDE 無關。 CKIP-LlaMa-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的 繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動 化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體 中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG( CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀 理解問答;在github網頁上也據實說明。 由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。 該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎 預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關 研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制 ,避免類似問題產生。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.77.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696854018.A.5E7.html

58 則留言

ghchen1978, 1F
一切都是幻覺,嘻嘻218.173.167.171

shimachokong, 2F
原來幻覺會告訴你元首是習近平61.230.143.35

CREA, 3F
全都是幻覺 嚇不倒我的104.28.232.15

KIKK, 4F
這樣也要30萬啊…114.136.183.209

k85564, 5F
ai是幻覺 我們生活的地方也是幻覺39.10.9.115

k85564, 6F
世界是虛擬的!39.10.9.115

zoeapezoo, 7F
Re: [爆卦] 中央研究院詞庫小組大型語言模型

una283, 8F
「個人小型實驗」還能上新聞宣傳真不簡單220.132.181.237

una283, 9F
Re: [爆卦] 中央研究院詞庫小組大型語言模型

bbc0217, 10F
Re: [爆卦] 中央研究院詞庫小組大型語言模型

sxy67230, 11F
個人實驗還能上新聞真好,阿肥能上新聞101.10.46.126

sxy67230, 12F
的機會都沒有101.10.46.126

bbs0840738, 13F
要上新聞吹就不要怪大家檢視啊36.234.155.18

una283, 14F
之前台灣的新聞似乎都下架了只剩下中國的220.132.181.237

a27588679, 15F
ai產生幻覺 這是奇異點吧180.177.33.135

sxy67230, 16F
我們政府很有效率耶,不輸對岸,一個命101.10.46.126

sxy67230, 17F
令媒體集體下架101.10.46.126

una283, 18F
https://bit.ly/45nLlU5220.132.181.237

una283, 19F
個人小型實驗發的台灣的新聞220.132.181.237

ErosAmour, 20F
笑死,台灣傻事一定會搬這一條。111.82.124.104

holyhelm, 21F
嚇不倒我的!!!!!59.127.221.37

garcia, 22F
假的!是你各位眼睛業障重1.170.83.218

una283, 23F
原新聞寫是「團隊」人工挑出的CIOG-PC220.132.181.237

una283, 24F
資訊所聲明稿跟兩天前的新聞稿差這麼多220.132.181.237

ImCPM, 25F
笑死1.161.203.115

cgntutim, 26F
30萬 笑死114.136.94.23

firose, 27F
就說了 繼續研究如何包裝118.168.81.169

firose, 28F
以達到看不出來的效果118.168.81.169

simon0529, 29F
這就是我們中研院研究員的素質?118.161.68.230

simon0529, 30F
難怪台灣停滯2、30年沒有突破性發展118.161.68.230

simon0529, 31F
一切都是幻覺118.161.68.230

jeff85898, 32F
要評論語言模型結果幻覺這個專有名詞不111.83.51.112

jeff85898, 33F
知道也太好笑111.83.51.112

jeff85898, 34F
30萬算上模型訓練用的硬體成本跟清理資111.83.51.112

jeff85898, 35F
料集的人力成本也差不多了吧111.83.51.112

una283, 36F
幻覺是中研院自己說的 不是評論220.132.181.237

una283, 37F
可能用英文怕記者翻錯220.132.181.237

una283, 38F
本來用幻覺這個字就容易一語雙關220.132.181.237
※ 編輯: gaymay5566 (36.234.77.82 臺灣), 10/09/2023 21:14:12

odaaaaa, 39F
30萬的1人團隊,怎麼有點熟悉!1.200.150.244

emissary, 40F
AI產生幻覺?那AI會不會知覺失調阿?XDD122.121.223.199

nakayamayyt, 41F
個人小型實驗新聞稿寫得這麼偉大118.161.115.230

firemothra, 42F
假的。你眼睛業障重114.40.102.6

rick917, 43F
原來我中了幻覺啊...@@"111.249.28.89

franktpmvu, 44F
幻覺的意思是 CHAT常常會捏造東西聊天122.116.150.216

franktpmvu, 45F
因為CHAT 的首要目標是聊的通順 不是122.116.150.216

franktpmvu, 46F
內容的正確性 所以你問一個不存在的東122.116.150.216

franktpmvu, 47F
西跟他聊天 他也可以講的好像真的存在122.116.150.216

franktpmvu, 48F
千萬不要相信任何CHAT宣稱的"正確性"122.116.150.216

franktpmvu, 49F
有時會看到CHAT會捏造參考資料來佐證122.116.150.216

franktpmvu, 50F
自己的觀點 但這些參考資料不存在於現122.116.150.216

tanby, 51F
最好是幻覺這麼精準啦 就數據有問題 你們49.216.16.141

tanby, 52F
沒有清理49.216.16.141

franktpmvu, 53F
實中122.116.150.216

fulongb210f, 54F
誰在認知作戰?124.218.155.138

ChungLi5566, 55F
你們餵它垃圾他當然產生垃圾116.241.253.112

Expend, 56F
Re: [爆卦] 中央研究院詞庫小組大型語言模型

pastevil, 57F
對,一切都是幻覺這樣解釋就都合理了1.163.140.118

changefly, 58F
一切都是幻覺辣101.137.10.136

gaymay5566 作者的近期文章

[問卦] 去美國設廠終究會失敗的 無法停止嗎?
大家都知道 美國員工的奴性根本無法跟亞洲員工比 大家也知道 去美國設廠終究會失敗的 所以 真的無法停止這必輸的這步棋嗎? 有卦嗎?
[問卦] 廢棄物處理是不是很賺啊?
聽聞 有朋友的老爸 在做廢棄物處理 已經買了三四間房了 然後常常請親戚辦桌 皮包裡總是一疊鈔票 靠邀 這是不是屌打台清交白領啊 或是GG/MTK工程師 有卦嗎?
[問卦] 台灣物價是不是越來越沒有地域之分?
除了房價有地域之分外 有沒有越來越覺得 北中南各地的物價都差不多貴 以為去中南部鄉下區吃東西比較便宜 結果好像也跟北部差不多貴 差不多又幹了幾次 用著差不多的姿勢 有卦嗎?--- Sent from MeowPtt on my Pixel
[問卦] 學建構式數學的那批人過得還好嗎?
建構式數學 1996年在台灣國小實施 2002年第一屆升上國中時 被判定數學計算能力「低落」 2003年教育部趕緊宣布不再以建構式數學為唯一數學教學 現在算一算這批人大概也30~34歲了 他們現在過得好嗎? 五子登科了嗎? 有卦嗎?
[問卦] 土木博士價值是不是很低?
魯叔鄰居 112土木博士畢業 但似乎都找不到教職 連講師也沒有 公務員、國營、業界 也都沒興趣 寧願跟著家人去菜市場賣東西 好歹土木也是工學院阿 又是112的 真的是今日土木 明日土城嗎? 有卦嗎?--- Sent from MeowPtt
更多 gaymay5566 作者的文章...