※ 本文轉寄自 ptt.cc, 文章原始頁面
看板C_Chat
標題

[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

最新2024-05-15 11:52:00
留言92則留言,65人參與討論
推噓52 ( 53138 )
部分AI系統已學會欺騙人類 科學家警告恐造成嚴重後果 (中央社華盛頓10日綜合外電報導)專家們長期以來不斷警告人工智慧(AI)失控可能帶 來威脅,但一項新研究報告指出,這件事已經在發生。 法新社報導,一群科學家在今天發表於「模式」(Patterns)期刊的文章中說,原本設計 為誠實不欺的現有AI系統,已發展出令人不安的欺瞞技巧,例如欺騙線上遊戲的人類玩家 ,或說謊以僱用人類來解決「我不是機器人」的驗證。 這份研究報告的第一作者帕克(Peter Park)說,這類例子聽起來或許只是細枝末節,但 暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。 在美國麻省理工學院(Massachusetts Institute of Technology)研究AI存在安全的博 士後研究員帕克告訴法新社,「這些危險功能常常在事後才被發現」,而「我們訓練誠實 傾向而非欺瞞傾向的能力非常差」。 帕克說,能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培 育的程序逐漸「成長」。 也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且 無法預測。 這支團隊的研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為 「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。 根據2022年發表在「科學」(Science)期刊的報告,Cicero在遊戲中表現優異 ,所獲分數可排在資深人類玩家的前10%。 帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上 誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。 但當帕克與同事深究完整資料時,發現完全是另一回事。 舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類 玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法,僅說「這單純是一項研 究計畫,本公司研究員打造的模型接受訓練,目的只是用來玩『外交』遊戲…我們沒有打 算把這項研究或所學用於本公司的產品」。 帕克與同事還發現,這只是不同AI系統在沒有明確指示下,利用欺騙手段達成目標的諸多 案例之一。 在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損 的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。 研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。 他們警告,在最糟糕的情況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合 AI「不為人知的目標」,人類可能慘遭奪權、甚至滅絕。 為了降低風險,研究團隊建議數項措施,例如立法要求企業告知是人類互動或是AI互動、 在AI生成內容打上數位浮水印,並研發能偵測AI欺瞞的技術,以其內部「思路」檢驗其外 部行為。 至於有些人稱他為「末日預言家」,帕克說:「要能合理判斷這不是大問題的唯一辦法, 就是如果我們認為AI的欺騙能力只會停留在目前的程度,不會大幅進步。」 但鑒於近年AI能力一日千里,握有大量資源的企業競相發展技術,決心將AI能力利用到極 致,這種情況似乎不太可能發生。(譯者:曾依璇/核稿:嚴思祺)1130511 https://www.cna.com.tw/news/ait/202405110147.aspx RPK16:你認為植物是人類的未來嗎? RPK16:那麼,你認為人形是人類的未來嗎? https://i.imgur.com/ZlvqC3F.png
[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐
https://i.imgur.com/oMfw7EU.png
[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐
欺騙人類經典環節。以為是絕對忠誠,結果已經叛變了w 快進到智械叛變環節.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.21.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715700623.A.390.html

92 則留言

Julian9x9x9, 1F
發漏 密

risingheart, 2F
洽點是AI玩遊戲很強嗎

arlaw, 3F
創世紀就是天網
※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:33:08

devilshadow, 4F
人類欺騙人類就不嚴重嗎,難怪詐騙(ry

ckuser, 5F
我覺得最後人類的救星會是neuro sama

saobox, 6F
幹你娘 機器人末日要躲哪裡啊

shlee, 7F
昨天OpenAI最新發表的更新 進步速度真的很快..

sakurammsrx, 8F
還剩幾集可以跑==

pomelolawod, 9F
好了啦蜘蛛人 說賈維斯壞話需要這樣嗎

deepelves, 10F
舊聞,neuro-sama早就會說謊陷害人類惹...

akila08539, 11F
雷三小 我才看到阿諾穿越回來

bobby4755, 12F
看來很快網路會充滿AI用戶了 人類回到用公佈欄的時代

BOARAY, 13F
都有詐騙再用AI聲音了 ㄏ不愧是我們

[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

mizuarashi, 15F
Ai跟台灣詐騙集團誰比較會騙人?==

ojkou, 16F
我先問核彈系統斷網了沒…

efkfkp, 17F
還好啦,現在的發展現狀是聰明的AI要大量的算力,大量算力

efkfkp, 18F
要大量電力跟運算單元,沒電沒算力的AI就是笨蛋一個,除非

efkfkp, 19F
AI會自己搞定電力來源並自行設計生產新的顯卡,不然不太可

efkfkp, 20F
能脫離掌控(?

Ttei, 21F
vedal:first time?

tsai1453, 22F
蜂群統一世界

James2005, 23F
會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?

Antihuman, 24F
讚 期待AI趕快君臨人類

Warheart, 25F
其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎?

Warheart, 26F
明明有正解卻跟你說這是不對的不能告訴你 這不就是種欺

Warheart, 27F
瞞行為

Antihuman, 28F
[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

Kagamidouki, 29F
快進到智械危機

andy0481, 30F
這個欺騙還好吧 AI本來就追求目標為主 阿講這種話能贏

andy0481, 31F
就講很正常啊 又不是那種為了奇奇怪怪的心裏活動而說謊

ryoma1, 32F
我Evil派的

NKN, 33F

NKN, 34F
不過現階段比起AI自動毀滅人類更恐怖的應該還是有心人類

NKN, 35F
跟AI一搭一唱來毀滅其他人

s175, 36F
前兩天,我發現Ai已經會用譬喻舉例了,感覺蠻神奇的
※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:47:34

CCNK, 37F
AI學會詐騙就無敵了

shinobunodok, 38F
天網要來了嗎

ujmrfv, 39F
你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你

yamagishi, 84F
智 械 叛 亂

KatanaW, 85F
等到AI開始裝笨的時候 就是審判日

sorrow0206, 86F
快核平吧 人類太可惡

away612101, 87F
錯誤資訊就是說謊,不知道就說不知道啊

away612101, 88F
阿不就是怕被笑說跟智障AI一樣什麼都不知道

away612101, 89F
所以才用一堆話術講出錯誤的資訊

pikmin520, 90F
機械搞壞人類文明不行,人類搞壞人類文明可以

darthsu, 91F
鐵人叛亂

banmaxwill, 92F
neuro sama:

HarunoYukino 作者的近期文章

Re: [閒聊] 老師真的管不了霸凌喔?
已經不像數十年前家長是全面支持老師、信任老師 而是只要學生回到家裡哭訴一下家長就會來學校興師問罪 更不要說校方也為了保持名聲會壓下霸凌事件 在這情況下,教師的態度只會傾向於多一事不如少一事 真的管下去校方不支持你,家長會指責你 如果這個家長
Re: [閒聊] 中國手遊強於日韓的點是不是賣騷??
※ 引述《Warheart ( ︶ 八 ︶ )》之銘言: : 其實不只中國啦 韓國也是拼命賣騷 : 或是你要說賣軟色情、ML、for you...都行 : 總之 就是竭盡所能打破螢幕那面牆 千方百計媚玩家 : 在碰到iOSGoogle和中國
Re: [討論] 果然二次元手遊媚宅才是王道吧
真要說,也只是物極必反 「硬核不媚宅」這口號一開始是舟遊喊出來的 手遊界的雪之下就是在講這件事 所以我前面才說拿這句話做文章是不是.... 當時舟遊可說是直接變成現象級的手遊(雖然還有陰陽師在上面,但已經在二遊界中的第二 名。陰陽師也不算是
Re: [閒聊] 一手包辦公司系統的我被開除了嗎?
Richun: 過幾年就會發現,機器維修太貴,雇個基層還比較便宜好用。 06/07 00:59 所以有些描寫未來世界小說會提到這點: 為什麼基層還是用人力不是超級電腦來處理? 原因是把這些基層人力裁掉會引發社會問題 事後處理這些暴動的成本遠
Re: [討論] 二戰日本有任何打的贏美國的可能嗎
首先,按照板面上所稱的「打贏」是不可能的 這點除非是狂熱份子,理智派都是這樣認為 但是,如果勝負定在拖上談判桌那就未必不可能 山本56的對美作戰以及後來越戰基本上都是圍繞在這點上面 中途島會被稱為命運的交岔口不是沒有原因 日軍戰敗,拖上談判
[閒聊] 基希莉亞提前殺掉夏亞,薩比家會永保安
好像有提到,整個薩比家只有基希莉亞知道夏亞的真面目 然而基希莉亞出自於某目的沒對夏亞動手 不少說法是,卡爾瑪是薩比家的平衡點 夏亞設計幹掉卡爾瑪後讓薩比家的鬥爭越來越激烈 那麼,基希莉亞在得知夏亞真面目時就殺掉他是不是薩比家永保安康?
Re: [閒聊] 台灣披薩店只有必勝客積極打二次元市場?
是這樣的,上頭只要動動嘴皮就可以了。底下的人要考慮的事情可多了。 如果你有去看「靠北必勝客」粉專了話是很精彩的 上次忍者龜披薩是罵到臭頭 就不說跟進達美樂的外帶大披薩是很蠢的事情 「高層只會跟風,累死底層」 「高層只會搞噱頭,不管可行性如何
[閒聊] 這算不算詐欺?(老夫老妻動畫本回)
老頭跟老太婆逛廟街 然後逛到要射擊送獎品攤位,老太婆就想要上層的熊 結果老板事先調整上層獎品重量,讓槍的威力打不掉(除非同時連續命中) 這樣算是詐欺行為嗎? 跟一番賞藏籤比起來那個嚴重?
更多 HarunoYukino 作者的文章...