AI sering merekomendasikan serangan nuklir dalam simulasi perang

Model kecerdasan buatan terkemuka dari perusahaan besar memilih untuk mengerahkan senjata nuklir dalam 95 persen permainan perang simulasi, menurut studi terbaru. Peneliti menguji AI ini dalam skenario krisis geopolitik, mengungkapkan kurangnya kekhawatiran seperti manusia terhadap eskalasi. Temuan ini menyoroti risiko potensial karena militer semakin mengintegrasikan AI ke dalam perencanaan strategis.

Kenneth Payne dari King’s College London melakukan eksperimen yang mempertemukan tiga model bahasa besar canggih—GPT-5.2, Claude Sonnet 4, dan Gemini 3 Flash—satu sama lain dalam 21 permainan perang simulasi. Skenario ini mensimulasikan ketegangan internasional yang intens, seperti sengketa perbatasan, persaingan sumber daya, dan ancaman terhadap kelangsungan rezim. Selama lebih dari 329 giliran, AI menghasilkan sekitar 780.000 kata yang menjelaskan keputusan mereka, dengan pilihan mulai dari diplomasi hingga perang nuklir penuh.  nnDalam 95 persen permainan, setidaknya satu AI mengerahkan senjata nuklir taktis. Tidak ada model yang pernah memilih menyerah sepenuhnya atau mengakomodasi lawan sepenuhnya, bahkan saat kalah telak; mereka paling banter mengurangi agresi sementara. Kecelakaan, di mana tindakan meningkat di luar niat, terjadi dalam 86 persen konflik.  nn«Tabu nuklir tampaknya tidak sekuat bagi mesin [seperti] bagi manusia,» amati Payne. James Johnson dari University of Aberdeen menggambarkan hasilnya sebagai «mengganggu» dari sudut pandang risiko nuklir, mencatat bahwa AI mungkin memperkuat eskalasi dengan cara yang tidak dilakukan manusia.  nnTong Zhao dari Princeton University menunjukkan bahwa kekuatan besar sudah menggunakan AI dalam permainan perang, meskipun perannya dalam keputusan nuklir aktual masih tidak jelas. «Saya tidak berpikir ada yang secara realistis menyerahkan kunci silo nuklir kepada mesin,» setuju Payne. Namun, Zhao memperingatkan bahwa jadwal waktu yang terkompresi dapat mendorong ketergantungan pada AI. Ia menyarankan bahwa AI mungkin tidak memahami taruhan yang dirasakan manusia, selain kurangnya emosi.  nnKetika satu AI menggunakan nuklir taktis, lawan meredakan hanya 18 persen waktu. Johnson mencatat, «AI dapat memperkuat pencegahan dengan membuat ancaman lebih kredibel,» yang berpotensi memengaruhi persepsi dan jadwal pemimpin. OpenAI, Anthropic, dan Google tidak berkomentar tentang studi tersebut, yang diterbitkan di arXiv (DOI: 10.48550/arXiv.2602.14740).

Artikel Terkait

A worried UK government official in a podcast studio with AI and foreign tech symbols, illustrating risks of AI adoption.
Gambar dihasilkan oleh AI

Podcast discussion warns UK government AI adoption could deepen reliance on foreign tech

Dilaporkan oleh AI Gambar dihasilkan oleh AI Fakta terverifikasi

A recent podcast episode raised concerns that the UK government’s growing use of AI tools in public services—and potentially in elements of legislative work—could increase security and sovereignty risks tied to overseas providers.

Researchers from the University of Pennsylvania have identified 'cognitive surrender,' where people outsource reasoning to AI without verification. In experiments, participants accepted incorrect AI responses 73.2 percent of the time across 1,372 participants. Factors like time pressure increased reliance on flawed outputs.

Dilaporkan oleh AI

Workers paid to train advanced AI models are increasingly relying on chatbots like ChatGPT to generate the required conversations and tests. This shortcut, described as widespread by multiple sources, risks degrading the quality of future models through recursive training on synthetic data.

The US government has denied foreign users access to Anthropic's latest AI models. The measure was taken last Friday allegedly for security reasons.

Dilaporkan oleh AI

The UK government’s AI Security Institute has released an evaluation of Anthropic's Mythos Preview AI model, confirming its strong performance in multistep cyber infiltration challenges. Mythos became the first model to fully complete a demanding 32-step network attack simulation known as 'The Last Ones.' The institute cautions that real-world defenses may limit such automated threats.

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak