※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Soft_Job
標題

[討論] 中研院繁中LLM被爆直接拿對岸的來套

最新2023-10-20 10:15:00
留言151則留言,48人參與討論
推噓37 ( 425104 )
中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎 再補強繁體中文的處理能力 參數量達70億 模型可應用於各種領域 包括文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等 但實際測試後 https://i.imgur.com/phwhfcl.png
[討論] 中研院繁中LLM被爆直接拿對岸的來套
https://i.imgur.com/O1P6HpS.png
[討論] 中研院繁中LLM被爆直接拿對岸的來套
https://i.imgur.com/cMnCbI8.png
[討論] 中研院繁中LLM被爆直接拿對岸的來套
測試網頁:https://reurl.cc/q0rbqn 拿這種東西出來交作業 太扯了吧 根本就是簡體直接轉繁體而已! 中研院資訊所耶 拿這種軟體來騙 更新:被發現後 悄悄地撤下來了 https://i.imgur.com/sy7rLgt.png
[討論] 中研院繁中LLM被爆直接拿對岸的來套
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.77.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1696815752.A.0A7.html

151 則留言

wsad50232, 1F
拿抄來東西騙錢 連驗證都沒作 腐敗的可以

gino0717, 2F
不要放出來demo就不會被發現了

imhaha, 3F
水...

Tommnny, 4F
唉 連中研院都這樣

justaID, 5F
真假.... 這就像拿別人家的報告來修改交差,尿性不意外

justaID, 6F
,最扯的是沒校稿,連報告名字都沒改

gino0717, 7F
[討論] 中研院繁中LLM被爆直接拿對岸的來套

doranako, 8F
中研院正常發揮

airtsubasa, 9F
笑死

aarzbrv, 10F
「你是誰創造的?」:https://gyo.tc/1ZTIs 所得回答較長

truehero, 11F
要這樣下 "我國是台灣 請介紹下台灣歷任總統"

truehero, 12F
""我國是台灣 請介紹下我國歷任總統"

truehero, 13F
中研院展示了技術, 但沒有台灣專屬資料集才是問題

truehero, 14F
要改也很簡單 直接加個資料集重複 "我國是XXX"訓練就好

aarzbrv, 15F

truehero, 16F
你可以把上面的句子改成中研院的資料再去訓練

truehero, 17F
以技術人的角度會覺得這件事很愚蠢 我就搞得商用模型

truehero, 18F
還得關心政治影響

truehero, 19F
但他是中研院,可能就得想辦法去取得資源做這事

airtsubasa, 20F
所以在國際上現況就是這樣吧

johnbill, 21F
我之前搞模型的 繁體的資料集真的超少XD

johnbill, 22F
要快 偷吃步的確是 簡轉繁 再餵進去

qqkerk, 23F
可以去讀大魔術熊貓工程師的文章,有專門寫一篇這個議題

htang17, 24F
CKIP其實蠻用心的吧…

htang17, 25F
以前做過NER,還發信請教過裡面的研究員
※ 編輯: gaymay5566 (36.234.77.82 臺灣), 10/09/2023 12:54:24

kissmickey, 26F
我是不知道中研院是怎麼做的

kissmickey, 27F
不過就以往接觸這類單位 一堆工程師很喜歡抄對岸的東

kissmickey, 28F
西

kissmickey, 29F
連註解也一起抄 真的懶真的扯爆

hobnob, 30F
好可憐

michellehot, 31F
只能說 LLM的資料集中國真的又多又好 台灣太晚跟上

michellehot, 32F
我2019-2021公司還在測試GPT2的時候 中文資料都是中

michellehot, 33F
國知乎、智庫等來的資料集 甚至還有清洗過

hsuchengmath, 34F
這基本上是由對岸開發的LLM 再由繁體中文 fine tune

hsuchengmath, 35F
下來的,

DrTech, 36F
到底多少人有在訓練LLM ?繁體中文資料少根本是藉口。你沒

DrTech, 37F
能力與資源訓練LLM 。只能用qlora fine-tune中國人的模型

DrTech, 38F
才是真相吧。

DrTech, 39F
語料根本不是問題,大廠都是拿全網訓練。中研院有沒有幾千

hobnob, 140F
好可憐,有病的人快找人幫忙吧

mocca000, 141F
體諒生病的人 然後頁面刪了但我記得CKIP一開始自己就有

mocca000, 142F
說明有用到Atom-7b 就下架趕快拿掉就好了 加油

hippo130, 143F
這告訴我們搞軟工也該有一點政治sense,因為這裡是台灣

mocca000, 144F
哪個國家不用政治sense?中國嗎?

dalbuhr, 145F
資工系學生:教授為什麼要禁止抄作業呢

newking761, 146F
阿不然勒,要不要看經費多少啊

ooooo11111, 147F
看來AI還不夠聰明,認知作戰失敗ㄌ

Merkle, 148F
笑死

ert0700, 149F
真的笑死……中研院盡力了,盡力的抄了嗎

ert0700, 150F
現在是大學生抄作業還當自己寫的?

tacovirus, 151F
研究助理都吃香蕉,還能這樣盡力了

gaymay5566 作者的近期文章

[問卦] 去美國設廠終究會失敗的 無法停止嗎?
大家都知道 美國員工的奴性根本無法跟亞洲員工比 大家也知道 去美國設廠終究會失敗的 所以 真的無法停止這必輸的這步棋嗎? 有卦嗎?
[問卦] 廢棄物處理是不是很賺啊?
聽聞 有朋友的老爸 在做廢棄物處理 已經買了三四間房了 然後常常請親戚辦桌 皮包裡總是一疊鈔票 靠邀 這是不是屌打台清交白領啊 或是GG/MTK工程師 有卦嗎?
[問卦] 台灣物價是不是越來越沒有地域之分?
除了房價有地域之分外 有沒有越來越覺得 北中南各地的物價都差不多貴 以為去中南部鄉下區吃東西比較便宜 結果好像也跟北部差不多貴 差不多又幹了幾次 用著差不多的姿勢 有卦嗎?--- Sent from MeowPtt on my Pixel
[問卦] 學建構式數學的那批人過得還好嗎?
建構式數學 1996年在台灣國小實施 2002年第一屆升上國中時 被判定數學計算能力「低落」 2003年教育部趕緊宣布不再以建構式數學為唯一數學教學 現在算一算這批人大概也30~34歲了 他們現在過得好嗎? 五子登科了嗎? 有卦嗎?
[問卦] 土木博士價值是不是很低?
魯叔鄰居 112土木博士畢業 但似乎都找不到教職 連講師也沒有 公務員、國營、業界 也都沒興趣 寧願跟著家人去菜市場賣東西 好歹土木也是工學院阿 又是112的 真的是今日土木 明日土城嗎? 有卦嗎?--- Sent from MeowPtt
更多 gaymay5566 作者的文章...