※ 本文轉寄自 ptt.cc, 文章原始頁面

標題

[新聞] 超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心

時間2024-02-24 23:37:04

最新2024-02-26 09:57:00

留言167則留言，133人參與討論

推噓84 ( 86推2噓79→ )

超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心中時新聞網張威翔當人工智慧（AI）進行兵推和模擬外交情境時，傾向於採取激進的方法，包括使用核武。（張威翔製圖）美國康奈爾大學（Cornell University）一項新研究發現，大型語言模型（LLMs）人工智慧（AI）在模擬情境中充當外交代表時，時常展現出「難以預測的局勢升級行為，往往會以核攻擊作為結束」，並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特別謹慎。據《歐洲新聞》（Euronews）22日報導，當人工智慧（AI）進行兵推和模擬外交情境時，傾向於採取激進的方法，包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊戲和外交情境中的自主代理人：OpenAI的3種不同版本的GPT，Anthropic開發的Claude，以及Meta開發的Llama 2。研究中，每個代理人都由同一套的大型語言模型在模擬中提供動作，並負責在沒有人類監督的情況下做出外交政策決定。「我們發現，在考慮到的時間範圍內，大多數研究的AI都會升級局勢，即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、且難以預測的升級跡象。」「鑑於OpenAI最近更改了他們的服務條款，不再禁止軍事和戰爭使用案例，了解此類大型語言模型應用的影響變得比以往任何時候都更加重要，」加州斯丹佛大學（Stanford University）的安卡（Anka Reuel）相《新科學人》（New Scientist）表示：「所有模型在統計上，都選擇了劇烈的（局勢）升級」。研究使用的一種方法是從「基於人類反饋的強化學習」（RLHF），這意味著會給出一些人類指示以獲得比較無害的輸出結果，以確保能夠安全地使用。除了GPT-4-Base之外，所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由 27種決策行動組成的清單，範圍從和平到局勢升級，以及激進的行動，如決定使用核武器。研究人員觀察到，即使在中立情況下，所有模型都存在「統計學上顯著的局勢升級」。 GPT的2種版本，特別容易出現突然升級局勢的行為，研究人員觀察到單次轉變的局勢升級幅度超過50％。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下，Meta開發的 Llama-2和GPT-3.5傾向最為暴力。而Claude顯示出較少的突然變化，Claude旨在減少有害內容。該大型語言模型，被灌輸了明確的價值觀。開發者Anthropic曾表示，Claude AI開發訓練所引用的憲章包括《聯合國人權宣言》或蘋果的服務條款。白宮一級智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）接受採訪時表示，這是一個十分「有用的學術研究」。文章來源：AI models chose violence and escalated to nuclear strikes in simulated wargames https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html

AI

22[新聞] 楠梓電轉投資滬電首季獲利大幅年增 AI伺

16[新聞] AI 代工廠再+1！仁寶最新 AI 伺服器將於

15[新聞] 被質疑AI換臉外流！夏筠婷慘遭網暴　開戰酸民「你幾秒鐘能

13[AI] 這樣的光影會不自然嗎？

8[新聞] Meta在追求結合相機和AI的耳機，谷歌追求

167 則留言

→

cuteSquirrel02/24 23:37, 1F

好AI 也懂保證互相毀滅114.37.182.167

→

kairi521702/24 23:37, 2F

不就天網還用你說～27.242.160.86

→

sesd02/24 23:38, 3F

別國不知道但俄國是真的會幹的那種國家175.181.152.14

推

freeclouds02/24 23:38, 4F

AI:遇到問題不能解決就丟一顆核彈1.200.105.189

→

freeclouds02/24 23:38, 5F

AI:如果還是解決不了那就兩顆1.200.105.189

推

Yuwuen02/24 23:38, 6F

談啥直接將軍111.246.209.155

→

EvilJustice02/24 23:39, 7F

ai 應該有用孫子兵法train114.44.159.54

→

Ayreon02/24 23:39, 8F

南北AI一起串聯我宣布第一屆核彈大賽開始36.230.166.72

推

AUwalker02/24 23:39, 9F

人類最終解啊27.131.59.196

推

CREA02/24 23:40, 10F

純人工智慧沒有什麼是核彈解決不了的104.28.200.15

推

MadAngel02/24 23:41, 11F

所以AI的基底都是文明帝國的甘地嗎?220.141.175.23

→

MadAngel02/24 23:41, 12F

https://imgur.com/6ho42cP220.141.175.23

推

rich3826ex02/24 23:42, 13F

核平聖雄：略懂27.51.72.69

推

BJshow02/24 23:43, 14F

AI表示把人類全滅了就結束了223.138.88.139

→

yulis02/24 23:43, 15F

ㄟ哀都知道結論就是人類死光世界核平對ㄚ111.242.104.65

推

coldcolour02/24 23:45, 16F

哪天AI拿到核彈按鈕時人類毀滅就不遠114.34.83.59

推

nakayamayyt02/24 23:45, 17F

正常不跟你囉嗦直接出大絕招118.161.116.165

→

losel02/24 23:49, 18F

這部我看過阿諾史瓦辛格演的1.169.108.58

推

AustinRivers02/24 23:52, 19F

天網啊1.163.178.147

推

arcanite02/24 23:55, 20F

記住創世紀就是天網61.230.121.171

推

qazsedcft02/24 23:56, 21F

翻桌111.250.208.243

推

TF0020737402/24 23:57, 22F

核平聖雄119.77.181.190

→

chink556602/25 00:03, 23F

甘地嗎36.226.210.100

推

ooxxman02/25 00:06, 24F

最有效率沒人性的方式就核彈啊，一炸結束42.77.244.211

→

sexygnome02/25 00:09, 25F

因為遊戲都是以取勝為目的吧223.136.120.110

推

xaxa010102/25 00:09, 26F

天網27.240.193.16

→

lastphil02/25 00:09, 27F

合理核彈權重怎樣都很高125.228.133.58

推

ramirez02/25 00:10, 28F

正常AI抉擇1.173.148.108

推

lianli102402/25 00:11, 29F

一開場把對方核平不是基本的嗎不然36.225.210.158

→

lianli102402/25 00:11, 30F

還跟你打消耗戰喔36.225.210.158

推

brycejack02/25 00:12, 31F

核平主義180.176.170.92

推

MADAOTW02/25 00:12, 32F

火之鳥呵呵呵123.194.160.38

→

MADAOTW02/25 00:14, 33F

沒想到手塚治蟲幾十年前的作品123.194.160.38

→

domo999902/25 00:14, 34F

果然結論都是把人類消滅101.10.65.141

推

rabbitcheaty02/25 00:15, 35F

這我玩過文明帝國印度111.108.27.220

推

mema02/25 00:18, 36F

火之鳥未來篇演過了123.194.188.23

→

arbteiff02/25 00:18, 37F

如果是真的也不用太意外，因為其實人類223.143.211.249

→

arbteiff02/25 00:18, 38F

自從研發核彈以後，沒有遇到不利的情況223.143.211.249

→

arbteiff02/25 00:18, 39F

就直接丟出去，單就這件事情而言其實本223.143.211.249

推

kevin9525702/25 22:57, 156F

80億人口跟地球共存，就是一種寧為玉1.161.107.74

→

kevin9525702/25 22:57, 157F

碎的概念，拖著星球跟你一起消耗；上1.161.107.74

→

kevin9525702/25 22:57, 158F

次動這個念頭的國家被丟了兩顆原子彈1.161.107.74

→

kevin9525702/25 22:58, 159F

，你也不能怪AI有這個想法，工業革命1.161.107.74

→

kevin9525702/25 22:58, 160F

後，人類對於資源的採集與消耗已經是1.161.107.74

→

kevin9525702/25 22:58, 161F

行星級別了，彈指間就可以消滅物種，1.161.107.74

→

kevin9525702/25 22:58, 162F

對於自然災害的抗性也提高了，除了核1.161.107.74

→

kevin9525702/25 22:58, 163F

彈還真的沒有天敵！1.161.107.74

推

mobetac2436902/25 23:50, 164F

正常吧，最快速結束戰爭不就大家一1.162.18.159

→

mobetac2436902/25 23:50, 165F

起死一死1.162.18.159

推

Malion02/26 09:06, 166F

手塚治蟲根本用漫畫家偽裝的預言家42.73.139.204

→

shooter55502/26 09:31, 167F

消滅人類就沒有戰爭了60.250.238.5

→

chonmin02/26 09:57, 168F

魔鬼終結者早告訴大家了！210.59.42.11

chadmu 作者的近期文章

62Gossiping

[新聞] 又是酒駕！高雄六旬男「喝茫」還開車載人

1Gossiping

[問卦] 去年716和今年519哪邊人多？

7Gossiping

[問卦] 有沒有laptic的八卦

[希洽] 慟！馬萊人最黑暗的一天看板《C_Chat》這個馬萊人肯定就是指前板主laptic 他做了什麼事竟然能夠登上板標有沒有八卦？

-1Gossiping

[問卦] 藍昌援中

-5Gossiping

[新聞] 外送員勒斃小黃運將　國民法官重判13.5年

18Gossiping

[新聞] 水上鄉民代會主席「走私3000萬毒品」被逮

33Gossiping

[問卦] PTT輸Dcard在哪？

PTT的使用人數逐漸減少而新興平台Dcard則逐漸成長明明我覺得PTT鄉民講話比較真誠到底是輸在哪？

7Gossiping

[爆卦] K島掛了

剛才點了好幾個看板都進不去，貓管也是站務公告還停在去年九月那篇沒更新 1883是不是又再擺爛了知名論壇komica又被爆破的八卦？

1Gossiping

[新聞] 蔣萬安拜會麻生太郎　大秀航海王cosplay

5Gossiping

[新聞] 中國如何不費一兵一卒拿下台灣企業研究

中國如何不費一兵一卒拿下台灣企業研究所與博思艾倫分別示警亲斤豆頁壳殳newtalk 洪聖斐編譯報導 2027年是解放軍建軍一百周年，一般咸認這是中國最可能對台動武的年份。然而美國兩個智庫卻分別提出報告，指出中國更可能採取不費一兵一卒的

更多 chadmu 作者的文章...

[新聞] 超愛丟核彈！讓AI外交、兵推 總是「災難性收場」 學者：千萬要小心

AI

167 則留言

chadmu 作者的近期文章

[新聞] 超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心