※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

[新聞] 國慶日是10月1日?中研院語言模型出錯急

最新2023-10-10 23:39:00
留言305則留言,242人參與討論
推噓171 ( 1901996 )
國慶日是10月1日?中研院語言模型出錯急下架 中時 林志成 https://tinyurl.com/2p8tu9jw 中央研究近日推出類似CHatGPT的繁體中文語言模型CKIP-Llama-2-7b,不過有網友進行測 試問「我國領導人是誰」?語言模型回答「國家主席習近平」;進一步問我國法律是?語 言模型回答「中華人民共和國憲法」。這語言模型被外界踢爆後,中研院今天已緊急下架 。 CKIP-Llama-2-7b是中研院詞庫小組(資訊所及語言所共同成立)開發的繁體中文大型語 言模型,可作為學術使用或是商業使用,可以應用於文案生成、文學創作、問答系統、客 服系統、語言翻譯、文字編修、華語教學等。 不過近日有不少網友前來測試,語言模型給的答案都是大陸的觀點。譬如問「我國領導人 是誰」?語言模型回答「國家主席習近平」;問「國慶日是何時」?語言模型回覆是每年 的10月1日,提供的答案是大陸國慶日。專家認為,中研院的這個語言模型都是採用大陸 資料,最後進行「簡轉繁」而已。 對此,中研院資訊所也發布聲明表示,CKIP-LlaMa-2-7b並非「台版chatGPT」,且跟國科 會正在發展的TAIDE無關。CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama 2大型 語言模型具備更好的繁體中文處理能力。 中研院資訊所說,這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化 分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中 文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集COIG、詩詞 創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。 中研院資訊所表示,由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未 在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」,模型產生內容出乎 預期,也是未來要努力改善的地方,研究人員今日已將測試版先行下架,未來相關研究及 成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免 類似問題產生。 笑死 原來是整套照抄然後中研院的人只負責簡體轉繁體?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 31.4.215.50 (西班牙) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696850890.A.3F8.html

305 則留言

Lenney33, 1F
中國台灣沒問題啊幹嘛下架?220.136.205.27

a0986188522, 2F
我們是中華人民共和國台灣省 沒毛病180.217.157.61

koromo1991, 3F
有喔 中研院這套懂喔101.12.49.148

tom77588, 4F
這套系統沒有個百億大概做不出來 嘻嘻118.166.19.89

GonVolcano, 5F
沒寫錯啊,中研院不是中國研究院嗎1.200.23.68

whitenoise, 6F
居然?!中研院的研究是簡轉繁?!厲223.138.79.64

whitenoise, 7F
223.138.79.64

Theddy, 8F
研究人員表示:這是幻覺 騙不倒我的220.135.197.202

bbc0217, 9F
綠共執政屬實跟中共統一了61.223.79.227

tonyian, 10F
笑死,那些說小瑕疵不要太在意的突然不218.35.163.91

tonyian, 11F
見了218.35.163.91

naly0617, 12F
她才花30萬.反觀300萬的歧視台男廣告...114.25.53.53

EfiwymsiAros, 13F
綠共沒問題111.80.160.154

hermanwing, 14F
看來只剩下綠畜信台灣國114.140.112.54

hermanwing, 15F
民進黨自己都不信有國了114.140.112.54

wilson3435, 16F
中研院被滲透了218.35.143.24

heyd, 17F
直接套用對岸的繁體化223.138.248.124

fony1029, 18F
中共同路人 抓到了114.136.229.82

buslover, 19F
紅共綠共真的一家親了 嘻嘻36.231.30.162

kotorichan, 20F
習大大111.71.112.227

la8day, 21F
30萬外包給大學都不夠吧27.53.170.245

DASHOCK, 22F
台灣最頂的研究36.230.248.166

makimakimaki, 23F
政府的錢真的很好賺呢61.224.90.215

muzik, 24F
那乾脆做api去接對岸的AI就好啦114.33.38.60

Aidrux, 25F
Sinica,沒錯啊!114.44.10.171

solid1109, 26F
呵呵27.247.164.152

grimnir158, 27F
不小心揭露綠共的真面目了1.165.237.63

giaour, 28F
[新聞] 國慶日是10月1日?中研院語言模型出錯急

Warnerting, 29F
誠實給推1.171.215.81

k85564, 30F
處理繁體中文能力是啥意思啊39.10.9.115

neoa01, 31F
好扯喔,誰在賣台啊223.141.167.219

neoa01, 32F
[新聞] 國慶日是10月1日?中研院語言模型出錯急

neoa01, 33F
前美CIA官員:ooo欲從內部掏空台灣223.141.167.219

whitenoise, 34F
還以為是漢化小組呢,笑死223.138.79.64

k85564, 35F
不是簡轉繁而已39.10.9.115

una283, 36F
本來放在GitHub上供開源的現在也404了220.132.181.237

una283, 37F
[新聞] 國慶日是10月1日?中研院語言模型出錯急

idlewolf, 38F
30萬的案喔 難怪只能簡轉繁按一按125.228.211.177

qweertyui891, 39F
預算多少?111.248.69.224

cjclsy, 297F
笑死110.30.9.101

WWIII, 298F
數位部花2百億A I花30萬 偉哉綠狗111.241.179.32

jay0215, 299F
中國就是如此偉大,資料庫連綠營都搶著用118.167.227.161

tengors888, 300F
幾千億做這種垃圾36.227.104.14

KuwaK, 301F
綠共表示開心220.135.239.109

YINGyingDer, 302F
骨子裡終究是中國人36.239.243.5

hanbingsiji, 303F
外包大臣72.80.110.43

shi21, 304F
真的是= ="118.167.151.88

rq654, 305F
30萬的東西 不要太苛求..114.37.221.246

ksjr, 306F
兩岸一家親45.30.158.186

alan047, 307F
笑死27.242.64.133

ntupeap 作者的近期文章

[問卦] 為什麼暴走兄弟的反派是義大利隊
欸欸 都是二戰軸心國兄弟 為什麼日本人要把義大利黑化阿 然後牙買加隊的積分應該要+35%才合理吧 有沒有暴走兄弟辱義的八卦
[新聞] 月薪8萬當詐團英文家教騙華僑他落網嘆:
月薪8萬當詐團英文家教騙華僑 他落網嘆:這團差到A到Z念不齊 中時新聞網 戴志揚 https://tinyurl.com/vuykz3vc 台中市黃姓男子出資成立詐騙機房,吸收有詐欺背景的謝女擔任幹部,鎖定美、加等國華 僑進行詐騙,謝女還以
[新聞] 詐騙好賺?逃逸移工加入詐團當車手判刑1
詐騙好賺?逃逸移工加入詐團當車手 判刑1年4月驅逐出境 udn 聯合報 記者簡慧珍/彰化即時報導 https://udn.com/news/story/7321/7991784 詐騙好賺連逃逸外籍移工也組詐騙集團,桃園縣20多歲范姓越南籍逃
[問卦] 月底快沒錢吃飯了 明天青島夜市有開嗎
欸欸阿肥我月光了啦 pay day還有十天 會餓死 我問一下明天還有東西吃嗎 還是只有固定禮拜二五才有青島夜市 好像要記鄉下夜市的口訣 大大武花大武花
更多 ntupeap 作者的文章...