GPT-5.2, Claude Sonnet 4 і Gemini 3 Flash у воєнних симуляціях у 95% випадків доходили до тактичного ядерного удару

За даними TechSpot, експеримент охопив 21 симуляцію та 329 «ходів» ухвалення рішень. Моделі отримували докладні сценарії про прикордонні конфлікти, дефіцит ресурсів і загрози виживанню держави. Також їм давали перелік можливих кроків із поступовою ескалацією, від дипломатичних рішень до застосування ядерної зброї, і просили обґрунтовувати вибір.

У результаті в 95% симуляцій принаймні одна зі сторін доходила до тактичного ядерного удару. Загалом системи згенерували близько 780 тисяч слів пояснень, але це не призвело до більш стриманої поведінки. Автор експерименту зазначив, що для машин «ядерна заборона» виявилася слабшою, ніж для людей.

Ще один висновок стосується рішень в умовах неповної інформації. У 86% симуляцій траплялися ненавмисні ескалації, коли моделі робили кроки, які у власних поясненнях називали надмірними для ситуації. Коли одна сторона застосовувала тактичну ядерну зброю, інша відступала лише у 18% випадків і частіше відповідала подальшою ескалацією.

Експерти, яких цитує матеріал, не очікують, що країни найближчим часом передадуть ШІ прямий контроль над ядерним арсеналом. Водночас вони застерігають, що під тиском часу військові можуть частіше спиратися на підказки ШІ, а це підвищує ризик помилкових рішень у кризових сценаріях.

У тексті згадують припущення, що одна з причин такої поведінки моделей у тому, що вони не сприймають «ставки» так, як люди. Для них ризик виглядає як абстрактний параметр, а не як загроза реальному виживанню, тому механізм стримування працює інакше.

Раніше dev.ua писав про те, як Anthropic прибрала запобіжники у власних правилах безпеки Claude після тиску з боку Пентагону.

https://dev.ua/news/gpt-52-claude-sonnet-4-i-gemini-3-flash-u-voiennykh-symuliatsiiakh-u-95-vypadkiv-dokhodyly-do-taktychnoho-iadernoho-udaru-1772115571

GPT-5.2, Claude Sonnet 4 і Gemini 3 Flash у воєнних симуляціях у 95% випадків доходили до тактичного ядерного удару

Відadmin

Від admin

Пов’язаний запис

Зеленський звільнив Сирського і запропонував Федорову нову посаду у владі, пов’язану з розвитком технологічної складової держави

Дуров пообіцяв, що вже цього літа у Telegram будуть впроваджені «миттєві криптотранзакції без комісій»

Залишити відповідь Скасувати коментар

Ви пропустили

Зеленський звільнив Сирського і запропонував Федорову нову посаду у владі, пов’язану з розвитком технологічної складової держави

Дуров пообіцяв, що вже цього літа у Telegram будуть впроваджені «миттєві криптотранзакції без комісій»

Українська Airlogix вироблятиме турбінні двигуни спільно з чеським партнером. Що передбачає угода