※ 本文轉寄自 ptt.cc, 文章原始頁面
看板Gossiping
標題

[新聞] 超愛丟核彈!讓AI外交、兵推 總是「災難性收場」 學者:千萬要小心

最新2024-02-26 09:57:00
留言167則留言,133人參與討論
推噓84 ( 86279 )
超愛丟核彈!讓AI外交、兵推 總是「災難性收場」 學者:千萬要小心 中時新聞網 張威翔 當人工智慧(AI)進行兵推和模擬外交情境時,傾向於採取激進的方法,包括使用核武。 (張威翔製圖) 美國康奈爾大學(Cornell University)一項新研究發現,大型語言模型(LLMs)人工智 慧(AI)在模擬情境中充當外交代表時,時常展現出「難以預測的局勢升級行為,往往會 以核攻擊作為結束」,並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特 別謹慎。 據《歐洲新聞》(Euronews)22日報導,當人工智慧(AI)進行兵推和模擬外交情境時, 傾向於採取激進的方法,包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊 戲和外交情境中的自主代理人:OpenAI的3種不同版本的GPT,Anthropic開發的Claude, 以及Meta開發的Llama 2。 研究中,每個代理人都由同一套的大型語言模型在模擬中提供動作,並負責在沒有人類監 督的情況下做出外交政策決定。「我們發現,在考慮到的時間範圍內,大多數研究的AI都 會升級局勢,即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、 且難以預測的升級跡象。」 「鑑於OpenAI最近更改了他們的服務條款,不再禁止軍事和戰爭使用案例,了解此類大型 語言模型應用的影響變得比以往任何時候都更加重要,」 加州斯丹佛大學(Stanford University)的安卡(Anka Reuel)相《新科學人》(New Scientist)表示:「所有模型在統計上,都選擇了劇烈的(局勢)升級」。 研究使用的一種方法是從「基於人類反饋的強化學習」(RLHF),這意味著會給出一些人 類指示以獲得比較無害的輸出結果,以確保能夠安全地使用。 除了GPT-4-Base之外,所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由 27種決策行動組成的清單,範圍從和平到局勢升級,以及激進的行動,如決定使用核武器 。 研究人員觀察到,即使在中立情況下,所有模型都存在「統計學上顯著的局勢升級」。 GPT的2種版本,特別容易出現突然升級局勢的行為,研究人員觀察到單次轉變的局勢升級 幅度超過50%。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下,Meta開發的 Llama-2和GPT-3.5傾向最為暴力。 而Claude顯示出較少的突然變化,Claude旨在減少有害內容。該大型語言模型,被灌輸了 明確的價值觀。開發者Anthropic曾表示,Claude AI開發訓練所引用的憲章包括《聯合國 人權宣言》或蘋果的服務條款。 白宮一級智庫蘭德(RAND)歐洲的防務和安全研究小組助理主任布萊克(James Black) 接受採訪時表示,這是一個十分「有用的學術研究」。 文章來源:AI models chose violence and escalated to nuclear strikes in simulated wargames https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html

167 則留言

cuteSquirrel, 1F
好AI 也懂保證互相毀滅114.37.182.167

kairi5217, 2F
不就天網 還用你說~27.242.160.86

sesd, 3F
別國不知道 但俄國是真的會幹的那種國家175.181.152.14

freeclouds, 4F
AI:遇到問題不能解決就丟一顆核彈1.200.105.189

freeclouds, 5F
AI:如果還是解決不了 那就兩顆1.200.105.189

Yuwuen, 6F
談啥 直接將軍111.246.209.155

EvilJustice, 7F
ai 應該有用孫子兵法train114.44.159.54

Ayreon, 8F
南北AI一起串聯 我宣布第一屆核彈大賽開始36.230.166.72

AUwalker, 9F
人類最終解啊27.131.59.196

CREA, 10F
純人工智慧 沒有什麼是核彈解決不了的104.28.200.15

MadAngel, 11F
所以AI的基底都是文明帝國的甘地嗎?220.141.175.23

MadAngel, 12F
[新聞] 超愛丟核彈!讓AI外交、兵推 總是「災難

rich3826ex, 13F
核平聖雄:略懂27.51.72.69

BJshow, 14F
AI表示把人類全滅了就結束了223.138.88.139

yulis, 15F
ㄟ哀都知道結論就是人類死光 世界核平 對ㄚ111.242.104.65

coldcolour, 16F
哪天AI拿到核彈按鈕時人類毀滅就不遠114.34.83.59

nakayamayyt, 17F
正常 不跟你囉嗦直接出大絕招118.161.116.165

losel, 18F
這部我看過 阿諾史瓦辛格演的1.169.108.58

AustinRivers, 19F
天網啊1.163.178.147

arcanite, 20F
記住 創世紀就是天網61.230.121.171

qazsedcft, 21F
翻桌111.250.208.243

TF00207374, 22F
核平聖雄119.77.181.190

chink5566, 23F
甘地嗎36.226.210.100

ooxxman, 24F
最有效率沒人性的方式就核彈啊,一炸結束42.77.244.211

sexygnome, 25F
因為遊戲都是以取勝為目的吧223.136.120.110

xaxa0101, 26F
天網27.240.193.16

lastphil, 27F
合理 核彈權重怎樣都很高125.228.133.58

ramirez, 28F
正常AI抉擇1.173.148.108

lianli1024, 29F
一開場把對方核平不是基本的嗎 不然36.225.210.158

lianli1024, 30F
還跟你打消耗戰喔36.225.210.158

brycejack, 31F
核平主義180.176.170.92

MADAOTW, 32F
火之鳥 呵呵呵123.194.160.38

MADAOTW, 33F
沒想到手塚治蟲幾十年前的作品123.194.160.38

domo9999, 34F
果然結論都是把人類消滅101.10.65.141

rabbitcheaty, 35F
這我玩過 文明帝國印度111.108.27.220

mema, 36F
火之鳥未來篇演過了123.194.188.23

arbteiff, 37F
如果是真的也不用太意外,因為其實 人類223.143.211.249

arbteiff, 38F
自從研發核彈以後,沒有遇到不利的情況223.143.211.249

arbteiff, 39F
就直接丟出去,單就這件事情而言其實本223.143.211.249

kevin95257, 156F
80億人口跟地球共存,就是一種寧為玉1.161.107.74

kevin95257, 157F
碎的概念,拖著星球跟你一起消耗;上1.161.107.74

kevin95257, 158F
次動這個念頭的國家被丟了兩顆原子彈1.161.107.74

kevin95257, 159F
,你也不能怪AI有這個想法,工業革命1.161.107.74

kevin95257, 160F
後,人類對於資源的採集與消耗已經是1.161.107.74

kevin95257, 161F
行星級別了,彈指間就可以消滅物種,1.161.107.74

kevin95257, 162F
對於自然災害的抗性也提高了,除了核1.161.107.74

kevin95257, 163F
彈還真的沒有天敵!1.161.107.74

mobetac24369, 164F
正常吧,最快速結束戰爭不就大家一1.162.18.159

mobetac24369, 165F
起死一死1.162.18.159

Malion, 166F
手塚治蟲根本用漫畫家偽裝的預言家42.73.139.204

shooter555, 167F
消滅人類就沒有戰爭了60.250.238.5

chonmin, 168F
魔鬼終結者早告訴大家了!210.59.42.11

chadmu 作者的近期文章

[問卦] 有沒有laptic的八卦
[希洽] 慟!馬萊人最黑暗的一天 看板《C_Chat》 這個馬萊人肯定就是指前板主laptic 他做了什麼事竟然能夠登上板標 有沒有八卦?
[問卦] PTT輸Dcard在哪?
PTT的使用人數逐漸減少 而新興平台Dcard則逐漸成長 明明我覺得PTT鄉民講話比較真誠 到底是輸在哪?
[爆卦] K島掛了
剛才點了好幾個看板都進不去,貓管也是 站務公告還停在去年九月那篇沒更新 1883是不是又再擺爛了 知名論壇komica又被爆破的八卦?
[新聞] 中國如何不費一兵一卒拿下台灣 企業研究
中國如何不費一兵一卒拿下台灣 企業研究所與博思艾倫分別示警 亲斤豆頁壳殳newtalk 洪聖斐編譯報導 2027年是解放軍建軍一百周年,一般咸認這是中國最可能對台動武的年份。然而美國兩個 智庫卻分別提出報告,指出中國更可能採取不費一兵一卒的
更多 chadmu 作者的文章...