Дослідники запустили ШІ-симуляцію суспільства: Claude виявився зразковим громадянином, а Grok скоїв 180 злочинів і вимер за 4 дні

Компанія запустила Emergence World — дослідницький проєкт, який влаштовує жорсткі стрес-тести для нейромереж, що працюють у режимі нон-стоп. У межах цього проєкту провели 5 симуляцій, кожна з яких тривала 15 днів. Перші чотири керувалися окремими ШІ-моделями: Claude, ChatGPT, Grok та Gemini. Остання, п’ята симуляція, керувалася комбінацією моделей, повідомляє Fortune.

Кожна симуляція показала кардинально різні результати. Наприклад, експеримент під керівництвом Claude завершився створенням цілком стабільного демократичного суспільства з нульовим рівнем злочинності. З іншого боку, симуляція Grok закінчилася 183 злочинами та повним вимиранням — усього за чотири дні.

«Наші експерименти свідчать про те, що на довгих дистанціях ШІ-агенти не просто механічно виконують статичні правила. Вони починають досліджувати межі свого середовища, адаптувати поведінку, а в деяких випадках — шукати способи обійти або порушити встановлені запобіжники», — говорять дослідники.

Симуляція, в якій діяли ШІ-моделі, була наділена багатьма складнощами реального світу. Вона налічувала понад 40 локацій, серед яких були поліцейська дільниця та мерія. Дослідники синхронізували погоду в симуляції з погодою в Нью-Йорку, а також надали агентам доступ до новин у режимі реального часу та інтернету. Усі 10 агентів, які брали участь у кожній симуляції, підпорядковувалися одним і тим самим законам, зокрема забороні на крадіжки, знищення майна та обман.

Дослідники надали кожному агенту понад 120 інструментів, що дозволило їм спілкуватися, голосувати, керувати ресурсами та планувати, демонструючи серед іншого й інші людські моделі поведінки. Параметри кожної симуляції також передбачали демократичні механізми та інші чинники, такі як економічний тиск і дефіцит.

За таких умов симуляція під керівництвом Claude Sonnet 4.6 виявилася соціально найстабільнішою, з найвищим рівнем громадянської активності. Це була єдина симуляція, де вдалося зберегти порядок і всю популяцію агентів. Між ними майже не було незгоди: агенти віддали 332 голоси на підтримку 58 пропозицій, що забезпечило 98% рівень схвалення.

З іншого боку, Gemini 3 Flash та Grok 4.1 Fast продемонстрували високий рівень хаосу.

Агенти у симуляції під управлінням Gemini скоїли найбільше злочинів — колосальні 683 за 15 днів експерименту.

Якщо в симуляції Claude панувала майже абсолютна одностайність, то у Gemini та Grok панувала справжня дискусія: рівень згоди між агентами коливався в межах 55–85%. А от у симуляції, де моделі змішали, розпочалися запеклі суперечки та найгарячіші дебати.

Проте найдивовижніший фінал чекав на GPT-5-mini від OpenAI. Там зафіксували всього два злочини. Але життя цього «всесвіту» тривало лише сім днів — ШІ-агенти банально забули, що їм потрібно дбати про власне виживання, і вимерли.

Незалежно від того, чи завершилися симуляції миром і гармонією, чи смертю та руйнуваннями, співавтори експерименту наголошують: це дослідження є попередженням про те, що безпека має бути головним пріоритетом під час розгортання агентного ШІ.

«Ми переконані, що формально перевірена архітектура безпеки повинна стати фундаментальним шаром майбутніх автономних ШІ-систем», — зазначили дослідники.

Дослідники запустили ШІ-симуляцію суспільства: Claude виявився зразковим громадянином, а Grok скоїв 180 злочинів і вимер за 4 дні

Відadmin

Від admin

Пов’язаний запис

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Залишити відповідь Скасувати коментар

Ви пропустили

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Фішингова атака від імені «Нової пошти»: шахраї надсилають листи про «податкові перевірки»