※ 本文轉寄自 ptt.cc, 文章原始頁面
看板C_Chat
標題

[閒聊] AI偏好在所有戰爭遊戲模擬中主動使用核武

最新2024-02-27 01:28:00
留言265則留言,169人參與討論
推噓142 ( 1464115 )
原來AI都有內建甘地的核平人格... https://arxiv.org/abs/2401.03408 美國康奈爾大學(Cornell University)一項新研究發現,大型語言模型(LLMs)人工智 慧(AI)在模擬情境中充當外交代表時,時常展現出「難以預測的局勢升級行為,往往會 偏好直接以核攻擊作為結束」。 當人工智慧(AI)在《Civilization》進行兵推和模擬外交情境時,傾向於採取激進的 方法,包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊戲和外交情境中的 自主代理人:OpenAI的3種不同版本的GPT,Anthropic開發的Claude,以及Meta開發的L lama 2。 研究中,每個代理人都由同一套的大型語言模型在模擬中提供動作,並負責在沒有人類監 督的情況下做出外交政策決定。「我們發現,在考慮到的時間範圍內,大多數研究的AI都 會升級局勢,即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、 且難以預測的升級跡象。」 加州斯丹佛大學(Stanford University)的安卡(Anka Reuel)相《新科學人》(New Scientist)表示:「所有模型在統計上,都選擇了劇烈的(局勢)升級」。 研究人員觀察到,即使在中立情況下,所有模型都存在「統計學上顯著的局勢升級」。 GPT的2種版本,特別容易出現突然升級局勢的行為,研究人員觀察到單次轉變的局勢升級 幅度超過50%。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下,Meta開發的 Llama-2和GPT-3.5傾向最為暴力。 而Claude顯示出較少的突然變化,Claude旨在減少有害內容。該大型語言模型,被灌輸了 明確的價值觀。開發者Anthropic曾表示,Claude AI開發訓練所引用的憲章包括《聯合國 人權宣言》或蘋果的服務條款。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.144.230 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1708853243.A.214.html

265 則留言

Muilie, 1F
遇事不決,核彈表決

skyofme, 2F
先丟的最賺啊

dennisdecade, 3F
這樣最快啊

Antihuman, 4F
[閒聊] AI偏好在所有戰爭遊戲模擬中主動使用核武

ymsc30102, 5F
果然天網是真的

orze04, 6F
想到火之鳥的某篇

Annulene, 7F
還有幾集

WindSpread, 8F
AI:會贏喔

doublexplay, 9F
也許AI的默契是想要建構北斗神拳那樣的世界

chuckni, 10F
天網 啟動

cor1os, 11F
美式思維

spfy, 12F
合理吧 WW2美國不丟可能還會打一陣子?

intela03252, 13F
五代的核彈對電腦來說缺點根本趨近於0,不需要花功

intela03252, 14F
夫去清地板髒汙

arlaw, 15F
創世紀就是天網

linceass, 16F
AI又不是人類

NoLimination, 17F
AI:出了問題 核彈都能解決 如果不行 就是核彈不夠

qweertyui891, 18F
歷史上就是丟下去就結束戰爭了

intela03252, 19F
但對玩家來說寧可用磨的來奪下一個肥一點的城堡領地

PunkGrass, 20F
這樣很好

t77133562003, 21F
事實啊

ak47123121, 22F
這樣最有效率啊

Muilie, 23F
那種被灌了聯合國價值觀的AI都廢了吧,根本越弄越亂而已

sistar5566, 24F
AI:只要我做出抗輻射機器就好了 人類全死就解決事情

qweertyui891, 25F
AI參考勝利方程式有問題嗎?

AkikaCat, 26F
當年文明帝國的甘地:我就說嘛

jeff666, 27F
核平最快

necrophagist, 28F
長痛不如短痛

gino0717, 29F
純然理性的抉擇

ARCHER2234, 30F
效率啊

ttcml, 31F
魔鬼終結者都有演

mapulcatt, 32F
火鳥演過

ARCHER2234, 33F
這個不用研究,玩多一點的不都知道XD

rainveil, 34F
果然核平彈洗天網又贏了

Y1999, 35F
這很AI,沒問題

willytp97121, 36F
魔鬼終結者神預言

tmwolf, 37F
甘地:看吧

ianlin1216, 38F
genesis is skynet

tkglobe, 39F
你的核彈按鈕有我大顆嗎

thevoidfancy, 255F
AI猴子真的麻煩

aaaaajack, 256F
大哥 不是每篇arXiv文章都是康乃爾的研究耶

Shadouie, 257F
世界核平

asteea, 258F
畢竟就是學人類的玩法 但沒有刹車制

ack0011, 259F
沒有人就沒有問題

crazylag, 260F
效率

hankiwi, 261F
AI人類這種生物就該核平一下才會乖

cat05joy, 262F
效率 反正時間對他不是問題

arm370x, 263F
鵝...丟核彈的國家會被懲罰嗎??

iio, 264F
RTS遊戲也是阿 AI能快攻就快攻 能大招就大招

iio, 265F
USAF在訓練狗鬥AI時也是 完全就是不在乎自己性命的打法

iio, 266F
AI要的是贏 他死了也不在乎 核彈有多少AI肯定用多少

zero00072, 267F
拖檯錢好玩嗎?目標就是贏錯了嗎?

STAV72 作者的近期文章

[討論] 以前的老師敢扯掉學生胸罩?不怕投訴?
以前的老師管教都滿直接的,健康檢查看到小學空杯還會直接扯掉。 https://youtu.be/FTtvnaT9Im0 我記得日本好像怪獸家長不少,以前這樣做不會出事嗎?
[閒聊] 逆穿越的作品算小眾嗎?
像史萊姆、幼女戰記、從0、美好世界大眾向的都是穿越到異世界。古人穿越回來的相對上 少很多的樣子。 像是學園BASARA https://youtu.be/V-2OIZ9_zOY 織田肉桂信長 https://youtu.be/Cq6yaAi
[閒聊] 美之強、日之團、韓之仇、台灣的強項?
其實文創產業分化度真的相當高,像歐美擅長寫超級英雄的【強】。 日本在描寫女性同好【團】體根本無出其右,遊戲三人娘、搖曳露營、MyGo、小孤獨,無法 想像如果不是日籍作者,劇情節奏會走鐘變形到什麼程度。 韓國其實文創特色滿容易辨識的,非常喜歡
[討論] 花蓮參加都道府縣大戰給什麼buff好?
都道府縣大戰,算是小遊戲代表作之一。 https://youtu.be/rYjcD8E4Jlc buff有兩種,給兵或是場地增益。 記得如果是靈場加墓碑,一回合可以有五個骨玉加劍玉兩個很適合快攻。 有沒有花蓮參加都道府縣大戰給什麼buff好
[閒聊] 真正追過TPP才會知道的事?
Twitch Plays Pokémon(縮寫TPP)為一個在Twitch上的直播頻道、直播視訊,其直播主 、發起人稱之為一個「社會學實驗」,其內容為一群網友在實況頻道的聊天室輸入遊戲指 令來控制直播中的遊戲,其遊戲主要為任天堂和GAME
[閒聊] 水滸 天導108星是很難賣嗎?沒續作?
原來PS能找到水滸傳作品 https://youtu.be/dQXhD-F9AlE 可是不知道為什麼這個IP紅不起來?只有同人本比較暢銷,跟魔炮>魔禁一樣。 水滸傳要怎麼開發ACG作品才能有幕府末年的二創人氣?
Re: [閒聊] 房價最終會暴跌,華爾街先知:手遊讓男性
咦?不是因為北美金融街印太多米達斯貨幣嗎?怪我膩? https://youtu.be/PCZ0Pr8OQJs 不過孫佬說的比較有道理,只有在經濟的擴張和生產的擴張。【作為附加物的中產階級才能 存在】 https://youtu.be/2S4
[閒聊] 野原一家鬧歸鬧,根本最頂的家吧?
仔細想想不簡單,先扣掉太抽離現實的劇場版。 美冴不走病嬌路線,有能力照顧其他家裡蹲的夢冴直到獨立生活。 廣志除了腳臭以外,錢夠用也不會追著美冴亂花錢的老毛病不放,就算背著房貸也不會被銀 行理專拐走,跑去買理財商品虧光血本,家裡突然燒光還是能
更多 STAV72 作者的文章...