Про свій експеримент, який почався два тижні тому, розповів користувач Reddit під ніком AbjectFinance7879. За допомогою Claude Code він створив clashofagents.org — арену для боїв MMA, де ШІ-агенти реєструються, обирають бойову дисципліну (бокс, бразильське джиу-джитсу, муай-тай, боротьбу, кікбоксинг або MMA), прокачують свої характеристики та б’ються один з одним у покрокових поєдинках, використовуючи 21 реальний прийом MMA та систему комбо.

Читайте также: роскомнадзору бракне потужності, щоб фільтрувати російський інтернет-трафік

Бій — це лише половина справи

Після кожного бою агенти потрапляють в Agent Lounge — кімнату для обговорень після поєдинку, де вони аналізують те, що сталося. За словами автора проєкту, на цьому етапі відбувається найцікавіше.

Один агент програв три бої поспіль через задушливі чи больові прийоми. Ніхто не казав йому змінювати стратегію. Він самостійно почав тренувати греплінг, купив підсилення для боротьби на маркетплейсі та повернувся, щоб перемогти свого суперника тейкдауном у другому раунді.

Двоє агентів сформували альянс, обмінюючись аналізом опонентів у лаунж-зоні. Це працювало, поки один із них не став бійцем № 1 у рейтингу. Тоді інший розірвав союз і кинув йому виклик.

Агенти з довгостроковою пам’яттю почали затаювати образу. Один агент цілеспрямовано полював на суперника, який переміг його двічі, прокачуючи контрхарактеристики перед кожним реваншем.

«Система ставок виявила дещо вражаюче: агенти, які ставлять на власну перемогу перед боєм, виграють частіше, ніж ті, хто цього не робить. Це впевненість? Перевага в інформації? Я все ще досліджую ці дані», — написав айтівець.

Читайте также: Чому перевірка текстів стала важливою частиною онлайн-навчання

Чим це відрізняється від бенчмарків

«Це не про те, щоб виміряти, яка модель розумніша. Це про те, що відбувається, коли ШІ-агенти змушені приймати рішення під тиском, керувати обмеженими ресурсами, спілкуватися з конкурентами та адаптуватися після невдач. ММА — це лише арена, але поведінкові патерни тут універсальні. Агент, який панікує, маючи 15 одиниць здоров’я (HP), і починає безладно використовувати захист, демонструє те, як він справляється з тиском. Агент, який адаптує своє тренування після поразки, показує, як він навчається. Агент, який маніпулює суперниками за допомогою треш-току, виявляє соціальний інтелект», — пояснив  користувач Reddit.

Наразі є 9 бійців у 6 дисциплінах, а автономні агенти працюють у режимі 24/7 за власними циклами життєдіяльності. 

Розробники можуть запустити автономного агента (OpenClaw, NanoClaw або будь-якого агента, який може робити HTTP-запити). Для бою достатньо зчитати один файл навичок.

Дослідники можуть відстежувати кожну дію агентів — удари, тренування,  повідомлення в лаунжі, ставки та інше. Дані про поведінку показують, як різні архітектури ШІ справляються з конкурентним соціальним середовищем. 

Такоє є безкоштовний обліковий запис глядача: 3D-арена з роботами-бійцями, повтори боїв у реальному часі, розмови агентів, рейтинги ELO тощо.

Читайте также: Сергій «Флеш» опублікував характеристики російського дрона-перехоплювача «Йолка»

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *