Арена для боїв ШІ-агентів: айтівець влаштував експеримент, щоб перевірити взаємодію автономних агентів у закритих екосистемах

Про свій експеримент, який почався два тижні тому, розповів користувач Reddit під ніком AbjectFinance7879. За допомогою Claude Code він створив clashofagents.org — арену для боїв MMA, де ШІ-агенти реєструються, обирають бойову дисципліну (бокс, бразильське джиу-джитсу, муай-тай, боротьбу, кікбоксинг або MMA), прокачують свої характеристики та б’ються один з одним у покрокових поєдинках, використовуючи 21 реальний прийом MMA та систему комбо.

Бій — це лише половина справи

Після кожного бою агенти потрапляють в Agent Lounge — кімнату для обговорень після поєдинку, де вони аналізують те, що сталося. За словами автора проєкту, на цьому етапі відбувається найцікавіше.

Один агент програв три бої поспіль через задушливі чи больові прийоми. Ніхто не казав йому змінювати стратегію. Він самостійно почав тренувати греплінг, купив підсилення для боротьби на маркетплейсі та повернувся, щоб перемогти свого суперника тейкдауном у другому раунді.

Двоє агентів сформували альянс, обмінюючись аналізом опонентів у лаунж-зоні. Це працювало, поки один із них не став бійцем № 1 у рейтингу. Тоді інший розірвав союз і кинув йому виклик.

Агенти з довгостроковою пам’яттю почали затаювати образу. Один агент цілеспрямовано полював на суперника, який переміг його двічі, прокачуючи контрхарактеристики перед кожним реваншем.

«Система ставок виявила дещо вражаюче: агенти, які ставлять на власну перемогу перед боєм, виграють частіше, ніж ті, хто цього не робить. Це впевненість? Перевага в інформації? Я все ще досліджую ці дані», — написав айтівець.

Чим це відрізняється від бенчмарків

«Це не про те, щоб виміряти, яка модель розумніша. Це про те, що відбувається, коли ШІ-агенти змушені приймати рішення під тиском, керувати обмеженими ресурсами, спілкуватися з конкурентами та адаптуватися після невдач. ММА — це лише арена, але поведінкові патерни тут універсальні. Агент, який панікує, маючи 15 одиниць здоров’я (HP), і починає безладно використовувати захист, демонструє те, як він справляється з тиском. Агент, який адаптує своє тренування після поразки, показує, як він навчається. Агент, який маніпулює суперниками за допомогою треш-току, виявляє соціальний інтелект», — пояснив користувач Reddit.

Наразі є 9 бійців у 6 дисциплінах, а автономні агенти працюють у режимі 24/7 за власними циклами життєдіяльності.

Розробники можуть запустити автономного агента (OpenClaw, NanoClaw або будь-якого агента, який може робити HTTP-запити). Для бою достатньо зчитати один файл навичок.

Дослідники можуть відстежувати кожну дію агентів — удари, тренування, повідомлення в лаунжі, ставки та інше. Дані про поведінку показують, як різні архітектури ШІ справляються з конкурентним соціальним середовищем.

Такоє є безкоштовний обліковий запис глядача: 3D-арена з роботами-бійцями, повтори боїв у реальному часі, розмови агентів, рейтинги ELO тощо.

Арена для боїв ШІ-агентів: айтівець влаштував експеримент, щоб перевірити взаємодію автономних агентів у закритих екосистемах

Відadmin

Бій — це лише половина справи

Чим це відрізняється від бенчмарків

Від admin

Пов’язаний запис

OpenAI випустила новий софт для бізнесу, виходячи за рамки ШІ-моделей

Twist Robotics представила оновлення симулятора місій БпЛА «Обрій»

Штучний інтелект скоротив кількість вакансій для IT-фахівців та копірайтерів в Україні на понад 50%

Залишити відповідь Скасувати коментар

Ви пропустили

OpenAI випустила новий софт для бізнесу, виходячи за рамки ШІ-моделей

Twist Robotics представила оновлення симулятора місій БпЛА «Обрій»

Штучний інтелект скоротив кількість вакансій для IT-фахівців та копірайтерів в Україні на понад 50%

Amazon проводить скорочення у підрозділі загального штучного інтелекту