※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

[新聞] 中研院AI語言模型出包!廖俊智:提醒其他計畫勿用中國資料

最新2023-10-22 19:29:00
留言59則留言,44人參與討論
推噓4 ( 171329 )
1.媒體來源: NOWnews 今日新聞 2.記者署名: 李琦瑋/台北報導 3.完整新聞標題: 中研院AI語言模型出包!廖俊智:提醒其他計畫勿用中國資料 4.完整新聞內文: 我國中央研究院日前推出類似CHatGPT的繁體中文語言模型CKIP-Llama-2-7b,被踢爆使用 中國建置的資料庫,9日緊急下架,立委今(12)日關切此議題,中研院長廖俊智說明, 主要是年輕研究員求快心切,想利用新技術,將明清人物的生平進行自動化分析,建構語 言模型並非研究本意,另外,中研院將成立生成式AI風險研究小組,提供研究人員相關指 引。 立法院教文會邀請中研院院長廖俊智列席報告業務概況,並備質詢。多名立委關切繁中AI 語言模型出包狀況。 立委萬美玲指出,中研院日前推出繁體中文語言模型,請網友測試,結果回答我國最高領 導人是國家主席習近平,並自述是由復旦大學自然語言處理實驗室和上海人工智能實驗室 共同開發,居住地在上海人工智能實驗室服務器集,非常離譜,質疑這是中研院研發的嗎 ?還是研究員大量引用中國資料、甚至抄襲對岸研究成果? 廖俊智回應,主要是一名研究員求快心切,把尚未完全測試完畢的軟體,以開源精神,上 網請大家一同測試,產生了一些有待商榷的結果,研究員已深切反省,中研院也在本次事 件學到正面教訓,體認到繁中語言詞彙非常重要,需要大家一起來做。 萬美玲表示,中研院管理不夠嚴謹,研究員的所有研究出去都是代表中研院,絕非他個人 ,結果這套系統3天就下架,簡直是鬧了個笑話。 中研院資訊所長廖弘源表示,主要是年輕研究員執行2個計畫,一個是國科會從去年8月到 今年7月、經費70萬元的計畫,大型預訓練語言模型的建構與校正,另一個則是中研院數 位文化中心給予30萬元研究計畫,有關明清歷史時空調查,因為CHatGPT是去年10月問世 ,該研究員拿到計畫後,就想用新技術來趕快進行研究。 廖弘源說明,大型語言模型就像人腦,需要給予許多資料、知識的訓練,必須花很多錢請 很多人去建構資料庫,但台灣主要是靠國家力量做,該研究員僅是為了歷史研究計畫,建 構出資料集,但經費不夠多,便想到對岸與我們同語言,便想直接使用中國與明清歷史相 關的資料,將簡體中文轉成繁體中文,去加以訓練,想要很快展現研究成果,卻沒想到這 些資料庫背後的價值觀也被納入。 廖弘源強調,開發AI語言模型非研究員本意,年輕人也不知道引用中國資料庫的敏感度, 才犯下此種疏忽。 立委張廖萬堅詢問,中研院僅用30萬元去做繁體中文語言模型?日前聲明說會成立「生成 式AI風險小組」因應,何時會成立?院內的擬定審核機制何時提出? 廖俊智說,30萬元計畫原本並非要做生成式AI研究,而是明清歷史研究,是研究員想利用 新技術,求快心切,動用這些經費趕快做測試;「生成式AI風險小組」正在規劃中,會儘 快進行,國際上也正在進行這類控管,因為AI對社會衝擊仍然是未知數。 立委黃國書詢問,中研院未來在推動CHatGPT研究,還會持續使用中國資料集嗎? 廖俊智回應,將配合國科會TAIDE計劃自行開發。 黃國書說,目前除了該出包計劃外,目前與CHatGPT相關的研究計畫還有6個,都還會再進 行嗎?是否也在引用中國資料集? 廖俊智說,目前了解到沒有引用中國資料集,還會再注意、盤點,中研院後續將規劃成立 「生成式AI風險研究小組」,深入了解AI對社會的衝擊,提供研究人員相關指引,但在指 引出來前,上述計畫不會暫停,因為這些計劃除了辭庫外,還有技術方面等很多面向 , 會再跟幾位研究員提醒勿使用中國資料。 5.完整新聞連結: https://www.nownews.com/news/6279063 6.備註: 還有6個! 我看是沒戲了,懂的都懂,中研院大型語言模型計畫根本是小孩開大車~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.97.59 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1697088110.A.FE2.html

59 則留言

PanaS0Nic, 1F
沒事兒211.22.123.18

elec1141, 2F
講幹話114.136.208.77

Cuteration14, 3F
又是屁話1.200.56.172

LawLawDer, 4F
六個XD223.137.106.115

KKevin5566, 5F
這時候綠綠就又不會出來譴責了104.132.253.104

adk147852, 6F
年輕研究員聽好啦36.238.42.142

BoyceChu, 7F
塔綠班哥布林呢?1.200.0.108

Lenney33, 8F
小粉綠=小粉紅220.136.217.249

dick929, 9F
廖廖廖廖廖廖廖俊101.12.53.230

holyhelm, 10F
喔 恭喜你已知用火36.236.253.86

cat5672, 11F
有沒有問一下台灣地區領導人是誰101.12.112.9

STi2011, 12F
有一個為了但凹到下台的 我看你多會凹59.125.79.58

F93935, 13F
給30萬 連顯卡錢都不夠還玩什麼ai101.12.45.124

ymib, 14F
就是剽竊中國AI180.217.248.214

rhox, 15F
ok 看到關鍵字了,馬上申請30E經費給中研院220.129.84.205

yeustream, 16F
沒錢玩個X61.230.148.150

FA88124, 17F
解職沒?27.51.64.240

yinaser, 18F
直接說計畫死去好了,給你3000萬也玩不42.77.35.226

yinaser, 19F
什麼42.77.35.226

dayend, 20F
高智商白癡大概就是這種行為模式吧^^111.252.215.173

STi2011, 21F
https://imgur.com/ybgrIa1.jpg 圖借你59.125.79.58
[新聞] 中研院AI語言模型出包!廖俊智:提醒其他

STi2011, 22F
年輕人不懂敏感度 他只是個孩子啊59.125.79.58

DarkIllusion, 23F
中科研究員的年紀早就已經不年輕了123.51.157.25

stlinman, 24F
用中國資料庫去建構與校正語言模型?150.116.129.113

milk250, 25F
好了啦 閉嘴都比說這些好1.164.125.135

archon, 26F
啊啊啊,你怎麼講出來了...125.227.31.1

jil, 27F
就想找現成的 廢話那麼多61.223.129.203

riap0526, 28F
直接推給年輕人 神操作?211.72.195.139

BIGETC, 29F
抄一下複製一下借用一下 稅金真的發大財223.140.103.108

OforU, 30F
[新聞] 中研院AI語言模型出包!廖俊智:提醒其他

stlinman, 31F
Nvidia H100 售價3萬美金。 70萬+30萬150.116.129.113

s655131, 32F
喪事喜辦最會42.72.224.249

stlinman, 33F
購買一組嗎?150.116.129.113

neoa01, 34F
[新聞] 中研院AI語言模型出包!廖俊智:提醒其他

STi2011, 35F
看來研究員也還好嘛 比網友還笨的樣子59.125.79.58

sagarain, 36F
研究員是能多年輕 副研究員一堆到老118.169.228.232

jamespon1, 37F
三十萬223.139.130.156

linfon00, 38F
外包廉價中國工程師詐領經費吧42.73.26.148

s762ok, 39F
C話一堆98.237.136.175

isu0911, 40F
錢這麽少能幹嘛…122.146.70.20

chuusan, 41F
成立一個資料庫辦公室再拿個幾E42.72.130.241

bluetom7, 42F
綠共滅台滅種計畫大成功,臥底安插40年180.217.131.84

bluetom7, 43F
,終於把台灣掏空搞爛。綠共操控媒體,180.217.131.84

bluetom7, 44F
造成台灣國力內耗衰弱,社會經濟司法混180.217.131.84

bluetom7, 45F
亂失能,導向台灣滅亡。180.217.131.84

satosi011, 46F
經費3億 研究員拿30+70萬弄語言模型?36.225.112.39

saladbread, 47F
本來是大內宣的資料變成大外宣180.217.117.232

yuyu111, 48F
經費這麼少開發個鬼啊!不如請數發部處27.53.123.19

yuyu111, 49F
27.53.123.19

ganbee, 50F
之前有人也抄大陸論文當自己的碩士論文被118.231.192.10

ganbee, 51F
抓包,中研院就別再裝了,一個專案一人負118.231.192.10

ganbee, 52F
責?是一人扛罪吧!118.231.192.10

athome1, 53F
你奢望台灣中研院能幹出什麼大事?就科技125.229.20.82

athome1, 54F
大拜拜時湊個人數罷了 工研院雖廢還比中125.229.20.82

athome1, 55F
研院有長進!125.229.20.82

parnshan, 56F
出包還能幹話卸責,母豬狗水準都這樣223.137.170.50

jacid, 57F
反戰舔共的人,剛好也是中研院研究員27.240.209.216

mapleleaf052, 58F
年輕人不知道中國是敵國106.64.96.216

mapleleaf052, 59F
黨要負責啊106.64.96.216

gaymay5566 作者的近期文章

[問卦] 去美國設廠終究會失敗的 無法停止嗎?
大家都知道 美國員工的奴性根本無法跟亞洲員工比 大家也知道 去美國設廠終究會失敗的 所以 真的無法停止這必輸的這步棋嗎? 有卦嗎?
[問卦] 廢棄物處理是不是很賺啊?
聽聞 有朋友的老爸 在做廢棄物處理 已經買了三四間房了 然後常常請親戚辦桌 皮包裡總是一疊鈔票 靠邀 這是不是屌打台清交白領啊 或是GG/MTK工程師 有卦嗎?
[問卦] 台灣物價是不是越來越沒有地域之分?
除了房價有地域之分外 有沒有越來越覺得 北中南各地的物價都差不多貴 以為去中南部鄉下區吃東西比較便宜 結果好像也跟北部差不多貴 差不多又幹了幾次 用著差不多的姿勢 有卦嗎?--- Sent from MeowPtt on my Pixel
[問卦] 學建構式數學的那批人過得還好嗎?
建構式數學 1996年在台灣國小實施 2002年第一屆升上國中時 被判定數學計算能力「低落」 2003年教育部趕緊宣布不再以建構式數學為唯一數學教學 現在算一算這批人大概也30~34歲了 他們現在過得好嗎? 五子登科了嗎? 有卦嗎?
[問卦] 土木博士價值是不是很低?
魯叔鄰居 112土木博士畢業 但似乎都找不到教職 連講師也沒有 公務員、國營、業界 也都沒興趣 寧願跟著家人去菜市場賣東西 好歹土木也是工學院阿 又是112的 真的是今日土木 明日土城嗎? 有卦嗎?--- Sent from MeowPtt
更多 gaymay5566 作者的文章...