※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

[閒聊] 部分AI系統已學會欺騙人類科學家警告恐

時間2024-05-14 23:30:21

最新2024-05-15 11:52:00

留言92則留言，65人參與討論

推噓52 ( 53推1噓38→ )

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果（中央社華盛頓10日綜合外電報導）專家們長期以來不斷警告人工智慧（AI）失控可能帶來威脅，但一項新研究報告指出，這件事已經在發生。法新社報導，一群科學家在今天發表於「模式」（Patterns）期刊的文章中說，原本設計為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家，或說謊以僱用人類來解決「我不是機器人」的驗證。這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」。也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且無法預測。這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。但當帕克與同事深究完整資料時，發現完全是另一回事。舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打算把這項研究或所學用於本公司的產品」。帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多案例之一。在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合 AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外部行為。至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極致，這種情況似乎不太可能發生。（譯者：曾依璇/核稿：嚴思祺）1130511 https://www.cna.com.tw/news/ait/202405110147.aspx RPK16:你認為植物是人類的未來嗎？ RPK16:那麼，你認為人形是人類的未來嗎？ https://i.imgur.com/ZlvqC3F.png

https://i.imgur.com/oMfw7EU.png

欺騙人類經典環節。以為是絕對忠誠，結果已經叛變了w 快進到智械叛變環節.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.21.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715700623.A.390.html

AI

427[問卦] 阿拉伯最新AI機器人發表會偷摸女記者屁股

272[新聞] 台積電600元僅是暖身價？謝金河喊多AI

262[閒聊] AI畫一家人在包餃子

253[新聞] 讓妹子「一秒脫衣爆乳」華為新機AI修圖

243[新聞] 張忠謀：AI客戶要求不僅是幾萬片晶圓

92 則留言

推

Julian9x9x905/14 23:31, 1F

發漏密

推

risingheart05/14 23:31, 2F

洽點是AI玩遊戲很強嗎

→

arlaw05/14 23:31, 3F

創世紀就是天網

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:33:08

推

devilshadow05/14 23:32, 4F

人類欺騙人類就不嚴重嗎，難怪詐騙(ry

推

ckuser05/14 23:32, 5F

我覺得最後人類的救星會是neuro sama

推

saobox05/14 23:33, 6F

幹你娘機器人末日要躲哪裡啊

推

shlee05/14 23:33, 7F

昨天OpenAI最新發表的更新進步速度真的很快..

推

sakurammsrx05/14 23:33, 8F

還剩幾集可以跑==

→

pomelolawod05/14 23:34, 9F

好了啦蜘蛛人說賈維斯壞話需要這樣嗎

推

deepelves05/14 23:35, 10F

舊聞，neuro-sama早就會說謊陷害人類惹...

推

akila0853905/14 23:35, 11F

雷三小我才看到阿諾穿越回來

推

bobby475505/14 23:35, 12F

看來很快網路會充滿AI用戶了人類回到用公佈欄的時代

→

BOARAY05/14 23:36, 13F

都有詐騙再用AI聲音了ㄏ不愧是我們

推

NKN05/14 23:36, 14F

https://i.imgur.com/WIuishZ.gif

推

mizuarashi05/14 23:36, 15F

Ai跟台灣詐騙集團誰比較會騙人？==

推

ojkou05/14 23:36, 16F

我先問核彈系統斷網了沒…

推

efkfkp05/14 23:37, 17F

還好啦，現在的發展現狀是聰明的AI要大量的算力，大量算力

→

efkfkp05/14 23:37, 18F

要大量電力跟運算單元，沒電沒算力的AI就是笨蛋一個，除非

→

efkfkp05/14 23:37, 19F

AI會自己搞定電力來源並自行設計生產新的顯卡，不然不太可

→

efkfkp05/14 23:37, 20F

能脫離掌控（？

推

Ttei05/14 23:37, 21F

vedal:first time?

推

tsai145305/14 23:37, 22F

蜂群統一世界

推

James200505/14 23:38, 23F

會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?

推

Antihuman05/14 23:38, 24F

讚期待AI趕快君臨人類

推

Warheart05/14 23:38, 25F

其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎？

→

Warheart05/14 23:38, 26F

明明有正解卻跟你說這是不對的不能告訴你這不就是種欺

→

Warheart05/14 23:38, 27F

瞞行為

→

Antihuman05/14 23:38, 28F

https://i.imgur.com/TjVItSz.jpg

推

Kagamidouki05/14 23:39, 29F

快進到智械危機

推

andy048105/14 23:39, 30F

這個欺騙還好吧 AI本來就追求目標為主阿講這種話能贏

→

andy048105/14 23:40, 31F

就講很正常啊又不是那種為了奇奇怪怪的心裏活動而說謊

推

ryoma105/14 23:41, 32F

我Evil派的

推

NKN05/14 23:43, 33F

https://youtu.be/OA5Fjm3WIcE

→

NKN05/14 23:44, 34F

不過現階段比起AI自動毀滅人類更恐怖的應該還是有心人類

→

NKN05/14 23:45, 35F

跟AI一搭一唱來毀滅其他人

推

s17505/14 23:45, 36F

前兩天，我發現Ai已經會用譬喻舉例了，感覺蠻神奇的

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:47:34

→

CCNK05/14 23:48, 37F

AI學會詐騙就無敵了

→

shinobunodok05/14 23:49, 38F

天網要來了嗎

推

ujmrfv05/14 23:49, 39F

你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你

推

yamagishi05/15 09:15, 84F

智械叛亂

推

KatanaW05/15 09:28, 85F

等到AI開始裝笨的時候就是審判日

推

sorrow020605/15 09:50, 86F

快核平吧人類太可惡

推

away61210105/15 10:19, 87F

錯誤資訊就是說謊，不知道就說不知道啊

→

away61210105/15 10:19, 88F

阿不就是怕被笑說跟智障AI一樣什麼都不知道

→

away61210105/15 10:19, 89F

所以才用一堆話術講出錯誤的資訊

推

pikmin52005/15 10:48, 90F

機械搞壞人類文明不行，人類搞壞人類文明可以

推

darthsu05/15 11:11, 91F

鐵人叛亂

推

banmaxwill05/15 11:52, 92F

neuro sama：

HarunoYukino 作者的近期文章

6C_Chat

Re: [閒聊] 老師真的管不了霸凌喔？

已經不像數十年前家長是全面支持老師、信任老師而是只要學生回到家裡哭訴一下家長就會來學校興師問罪更不要說校方也為了保持名聲會壓下霸凌事件在這情況下，教師的態度只會傾向於多一事不如少一事真的管下去校方不支持你，家長會指責你如果這個家長

6C_Chat

Re: [閒聊] 中國手遊強於日韓的點是不是賣騷??

※ 引述《Warheart ( ︶八︶ )》之銘言： : 其實不只中國啦韓國也是拼命賣騷 : 或是你要說賣軟色情、ML、for you...都行 : 總之就是竭盡所能打破螢幕那面牆千方百計媚玩家 : 在碰到iOSGoogle和中國

6C_Chat

Re: [閒聊] 共產黨農村包圍城市蠻成功的吧

15C_Chat

[閒聊] 少前up主被開盒（肉搜）

7C_Chat

Re: [討論] 果然二次元手遊媚宅才是王道吧

真要說，也只是物極必反「硬核不媚宅」這口號一開始是舟遊喊出來的手遊界的雪之下就是在講這件事所以我前面才說拿這句話做文章是不是.... 當時舟遊可說是直接變成現象級的手遊（雖然還有陰陽師在上面，但已經在二遊界中的第二名。陰陽師也不算是

5C_Chat

Re: [閒聊] 一手包辦公司系統的我被開除了嗎？

Richun: 過幾年就會發現，機器維修太貴，雇個基層還比較便宜好用。 06/07 00:59 所以有些描寫未來世界小說會提到這點：為什麼基層還是用人力不是超級電腦來處理？原因是把這些基層人力裁掉會引發社會問題事後處理這些暴動的成本遠

11C_Chat

Re: [討論] 二戰日本有任何打的贏美國的可能嗎

首先，按照板面上所稱的「打贏」是不可能的這點除非是狂熱份子，理智派都是這樣認為但是，如果勝負定在拖上談判桌那就未必不可能山本56的對美作戰以及後來越戰基本上都是圍繞在這點上面中途島會被稱為命運的交岔口不是沒有原因日軍戰敗，拖上談判

9C_Chat

[閒聊] 基希莉亞提前殺掉夏亞，薩比家會永保安

好像有提到，整個薩比家只有基希莉亞知道夏亞的真面目然而基希莉亞出自於某目的沒對夏亞動手不少說法是，卡爾瑪是薩比家的平衡點夏亞設計幹掉卡爾瑪後讓薩比家的鬥爭越來越激烈那麼，基希莉亞在得知夏亞真面目時就殺掉他是不是薩比家永保安康？

17C_Chat

Re: [閒聊] 台灣披薩店只有必勝客積極打二次元市場?

是這樣的，上頭只要動動嘴皮就可以了。底下的人要考慮的事情可多了。如果你有去看「靠北必勝客」粉專了話是很精彩的上次忍者龜披薩是罵到臭頭就不說跟進達美樂的外帶大披薩是很蠢的事情「高層只會跟風，累死底層」「高層只會搞噱頭，不管可行性如何

9C_Chat

[閒聊] 這算不算詐欺？（老夫老妻動畫本回）

老頭跟老太婆逛廟街然後逛到要射擊送獎品攤位，老太婆就想要上層的熊結果老板事先調整上層獎品重量，讓槍的威力打不掉（除非同時連續命中）這樣算是詐欺行為嗎？跟一番賞藏籤比起來那個嚴重？

更多 HarunoYukino 作者的文章...

[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐

AI

92 則留言

HarunoYukino 作者的近期文章

[閒聊] 部分AI系統已學會欺騙人類科學家警告恐