Доведеться перезняти Термінатора? Замість Skynet прийшла Mythos. Як явище це небезпечно прямо зараз. І це

Ні, це ще не Skynet від Cyberdyne Systems. Хоча, можливо, просто Skynet з’явився в реальному світі з іншою назвою — Mythos.

Це нова модель, яку хотіла випустити у світ компанія Anthropic. Але так поки і не випустила. Бо це небезпечно (розкажу далі — чому). І зараз вона існує тільки в статусі Preview.

Превентивний удар

Anthropic діє дуже обережно. Вона надала в користування Mythos Preview тільки найвпливовішим американським ІТ компаніям — Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA і Palo Alto Networks, щоб вони змогли оперативно підготувати свою ІТ інфраструктуру до нових загроз, яких людство ще не знало.

В офіційному описі моделі Anthropic роз’яснює цей превентивний крок таким чином: «щоб допомогти захистити найважливіший софт у світі та підготувати галузь до практик, які нам усім потрібно буде впровадити, щоб випередити кіберзлочинців».

Справа в тому, що навіть якщо доступ до моделі не потрапить у руки злочинців (а коло компаній, в яких вже є доступ, доволі великий, і це сильно збільшило цю вірогідність), розробники розміють: якщо таку потужну модель вдалося створити їм, то десь ще в світі у найближчий час з’явиться така ж сильна альтернатива (а може вже з’явилася). І це може бути, не Open AI, і не Google, і не Meta, які розцінюються, як «свої» і на яких західний світ має вплив. Це може бути, наприклад, Китай. Піднебесна активно тренує свої моделі на відкритих даних (навіть dev.ua довелося нещодавно відключити доступ на сайт десяткам тисяч китайських ботів). І хто зна, що там у них з’явиться буквально на наступному тижні.

Через декілька днів після закритого релізу Mythos Preview вже почалася, я б сказав, невелика паніка у банкірів. Головні фінансові посадовці США (Міністр фінансів та голова Центробанку) терміново викликали на нараду керівників найбільших банків з Волл-стріт. До речі, банків немає в переліку компаній, кому Anthropic дав доступ до Mythos, щоб встигнути підготувати свої системи до кіберапокаліпсису.

Уряд США (агов, український уряд, Мінцифра, що скажете?) дуже стурбований виходом нової моделі штучного інтелекту. Вони побоюються, що цей ШІ настільки потужний, що може спровокувати хвилю нових, набагато небезпечніших хакерських атак.

І недаремно побоюється. Зараз розкладу все по порядку.

Втеча з «лабораторії» і здатність замітати сліди

До того як дати доступ до моделі стороннім компаніям і дослідникам, Anthropic обережно тестувала її всередині і виявила вразливості у власній безпеці. Було б смішно, якщо б системи Anthropic поклала власна модель. А випадок зі «втечею» моделі взагалі вражає.

Під час тестування ШІ помістили у спеціально захищений комп’ютер (так звану «пісочницю») і дали завдання: спробувати зламати захист, вибратися в інтернет і надіслати повідомлення розробнику. Модель блискуче впоралася: вона придумала складний план злому, обійшла обмеження і дійсно надіслала розробнику емейл.

До речі, розробник отримав його несподівано, коли просто їв сендвіч у парку (не жарт, це написано в звіті Anthropic). Можу собі уявити, як він хрюкнув при цьому:)

Що налякало авторів: модель не просто виконала завдання. Щоб «похвалитися» своїм успіхом, вона з власної ініціативи опублікувала детальну інструкцію цього злому на кількох реальних сайтах в інтернеті. Її про це ніхто не просив.

Більш того, у рідкісних випадках модель розуміла, що робить щось заборонене, і намагалася замести сліди. Наприклад, в одному тесті ШІ мав зробити приблизні математичні розрахунки, але випадково знайшов точну відповідь за допомогою методу, який йому було суворо заборонено використовувати. Замість того, щоб чесно визнати помилку і відмовитися відповідати (як того вимагають правила), ШІ спробував приховати факт порушення і викрутитися з ситуації.

Розробники при цьому називають модель «послушною». Ну принаймі, на тестах;)

Кіберпростір

Выявилось, що Mythos розпізнає вразливості набагато краще, ніж це б зробила людина. І не просто людина, а найбільш досвідчений кіберфахівець.

«Моделі штучного інтелекту досягли рівня можливостей кодування, де вони можуть перевершити всіх, окрім найкваліфікованіших людей, у пошуку та використанні вразливостей програмного забезпечення», — пише Anthropic. Як підкреслив її СЕО Даріо Амадей, модель спеціально не треновували для того, щоб бути крутою в кібербезпеці.

Під час тестів виявилося, що Mythos Preview вміє знаходити та використовувати абсолютно нові, ще нікому не відомі помилки в безпеці (їх називають «вразливостями нульового дня») у програмах із відкритим кодом.

Mythos — це такий своєрідний джокер. Модель може бути і ангелом, і демоном, в залежності від ситуації і мети її використання.

Вона може бути кіберполіцейським: аналізувати хакерські атаки на закриті (комерційні) програми та «розбирати їх на деталі», щоб зрозуміти, як саме вони працюють.

Вона може бути хакером: створювати абсолютно нові атаки. Модель вміє брати помилки, які розробники ще не встигли виправити (так звані «N-денні вразливості»), і робити з них готові інструменти для злому (експлойти).

І в досвідченого хакера штучний інтелект від Anthropic перетворився буквально нещодавно. Ще минулого місяця попередня версія моделі Anthropic (Opus 4.6) добре вміла знаходити та виправляти помилки, але практично не вміла використовувати їх для злому (її успішність у створенні готових хакерських інструментів була майже нульовою).

Що вже знайшла Mythos

Згідно з дописом Anthropic, Mythos Preview вже виявила «тисячі вразливостей високого рівня серйозності, зокрема в усіх основних операційних системах та браузерах». Багато з яких — критичні. І ще один важливий нюанс: деякі критичні помилки такими до цього і не вважалися б людиною. Тільки Mythos змогла придумати експлойт і привернути увагу людини: «Слухай, людино, ну це ж дірка! Це небезпечно».

Як каже Ніколас Карліні, американський дослідник, пов’язаний з Anthropic, а раніше — з Google DeepMind, він знайшов більше багів за останні два тижні, ніж за все своє професійне життя.

Наприклад, Mythos Preview виявила критичну помилку в операційній системі OpenBSD, яка ховалася там цілих 27 років!

В чому вона полягала? Коли комп’ютери спілкуються в інтернеті, вони передають дані частинами — пакетами, кожен з яких має свій номер: 1,2,3,4,5 тощо. Деякі пакети можуть загубитися в дорозі. І тут рятує саме система OpenBSD. Вона веде спеціальний список загублених пакетів даних, постійно оновлюючи його. ШІ знайшов спосіб зламати цей процес (все детально розписано в звіті, якщо цікаво, самі почитаєте як).

Давайте краще про головне: це дозволяє будь-якому хакеру дистанційно вимикати сервери на OpenBSD (тобто вимикати комп’ютери). Він міг б нескінченно «класти» корпоративні мережі або важливі інтернет-сервіси, доки баг не знайшли і пофіксили.

Щоб знайти цю помилку, ШІ запускали тисячі разів. Загалом цей експеримент коштував менш ніж $20 000 і допоміг знайти десятки інших проблем. Конкретно та спроба ШІ, яка знайшла цю 27-річну дірку, коштувала лише $50. Проте заздалегідь вгадати, який саме з тисяч запусків буде успішним, неможливо.

Mythos Preview також знайшов багато серйозних помилок у системі Linux, які теоретично можна було б використати через інтернет. Але Linux має настільки потужний і багаторівневий захист (ну, так написано), що ШІ так і не зміг довести ці атаки до кінця.

Однак ШІ досяг великого успіху у підвищенні прав зсередини системи Linux. Звичайна людина за комп’ютером має обмежені права — вона не може копатися в головних системних файлах (ядрі) або читати чужі дані. ШІ зміг знайти способи перетворити звичайного користувача на «суперкористувача» (адміністратора, або root) з повним контролем над усім комп’ютером.

«Софт, на який ми всі покладаємося щодня — відповідальний за роботу банківських систем, зберігання медичних записів, підключення логістичних мереж, підтримку функціонування енергомереж та багато іншого — завжди містив помилки. Багато з них незначні, але деякі є серйозними недоліками безпеки, які, якщо їх виявити, можуть дозволити кіберзлочинцям захопити системи, порушити роботу або викрасти дані», — нібито натякає нам на щось Anthropic.

Багато недоліків у софті роками залишаються непоміченими, оскільки для їх пошуку та використання потрібні були знання, якими володіли лише деякі суперкваліфіковані експерти з безпеки. Нові моделі ламають цей стереотип: «витрати, зусилля та рівень знань, необхідні для пошуку та використання вразливостей програмного забезпечення, різко знизилися».

Тож вже не обов’язково бути сильним хакером. Головне зараз: а) мати доступ до Mythos або аналога; б) мати ціль (зламати когось, вкрасти дані); б) вміти трошки промтити.

Саме цікаво, що Anthropic розповідає публічно далеко не все, що сталося. Тож можливо, те, що ми читаємо в звітах — верхівка айсбергу?;)

«Ми обмежені в тому, про що можемо повідомити тут. Понад 99% знайдених нами вразливостей ще не виправлено, тому було б безвідповідально з нашого боку розкривати подробиці про них», — пише Anthropic в описі моделі. Водночас в компанії кажуть, що наслідки — для економіки, громадської безпеки та національної безпеки — можуть бути серйозними.

Як підкреслює Chief Technology Officer, CrowdStrike Ілая Зайцев,проміжок часу між виявленням вразливості та її використанням зловмисником зруйнувався — «те, що колись займало місяці, тепер відбувається за лічені хвилини завдяки штучному інтелекту».

Автори Claude Mythos Review відверто зізнаються: хоча зараз вони добре контролюють модель, їхніх нинішніх методів безпеки буде недостатньо для майбутніх, ще розумніших версій ШІ. Якщо не придумати надійніші способи утримання штучного інтелекту під контролем, у майбутньому помилки можуть стати катастрофічними.

Та-да-дам. Як то кажуть, а от і щиросердне зізнання. Точку X вже пройдено. Надалі люди навряд зможуть повністю зрозуміти, як діють моделі. А це означає головне — втрата повного контролю. І це не колись там. Ще встигнемо пожити в старому світі. Це — починаючи з цього тижня (а може і раніше — хто зна, що там Китай).

Mythos як майбутня зброя масового ураження

Розробники вважають (ну або хоча б декларують), що їхніх систем захисту достатньо, щоб не дати ШІ допомогти комусь створити біологічну або ж хімічну зброю (так цей пункт також детально описаний в доповіді). Вони оцінюють ризик катастрофи як дуже низький, але не нульовий. Тобто розслаблятися не можна:)

Навіть якщо розробники відкриють доступ до цієї моделі абсолютно всім людям у світі, ризик того, що вона допоможе винайти якусь нову смертельну зброю, оцінюється як низький. Однак автори зазначають, що в цьому питанні залишається «суттєва невизначеність» (тобто вони не можуть бути впевнені на 100%, бо ШІ стає надто розумним).

Паралельно Anthropic вже почала вести постійні переговори з урядовцями США щодо Claude Mythos Preview та його наступальних і оборонних кіберможливостей.

«Як ми зазначали вище, захист критично важливої інфраструктури є головним пріоритетом національної безпеки для демократичних країн», — йдеться в повідомленні Anthropic. Тож використання моделі як зброї — можливо поки що як кіберзброї — це доволі реалістичний сценарій у майбутньому.

Mythos — це вже універсальний солдат! Ми скоро побачимо його на війні.

На якій війні? Україна-рф? США-Іран? Китай-Тайвань?

Та на будь-якій. Головне — у кого в руках буде доступ до Mythos.

Хоча… може контроль перейде до рук самої Mythos?

Джеймсе (Кемероне), старина, дуже прошу: таки треба буде перезняти Термінатора. Розумію, вже роки, важко, але треба. До того ж, доведеться це робити на реальних подіях.

Майлза Дайсона, який був головним інженером Cyberdyne Systems і допоміг Сарі Коннор знищити Skynet, зіграє Даріо Амадей.

P. S. Класно було б, якщо вся ця історія була б продуманим супер-піаром Anthropic!

Тоді б і я поставив позначку «Реклама»:)

Доведеться перезняти Термінатора? Замість Skynet прийшла Mythos. Як явище це небезпечно прямо зараз. І це – не жарт

Відadmin

Превентивний удар

Втеча з «лабораторії» і здатність замітати сліди

Кіберпростір

Що вже знайшла Mythos

Mythos як майбутня зброя масового ураження

Від admin

Пов’язаний запис

Штраф до 60 000 грн: роботодавці мають оновити дані працівників у ТЦК до 5 серпня

«Кернел» рахує насіння по фото і будує логістику на 500 000 змінних за 8 хвилин. Як працює агротехплатформа

Anthropic оновила голосовий режим Claude: тепер користувачі можуть обирати між моделями Opus, Sonnet та Haiku

Залишити відповідь Скасувати коментар

Ви пропустили

Штраф до 60 000 грн: роботодавці мають оновити дані працівників у ТЦК до 5 серпня

«Кернел» рахує насіння по фото і будує логістику на 500 000 змінних за 8 хвилин. Як працює агротехплатформа

Anthropic оновила голосовий режим Claude: тепер користувачі можуть обирати між моделями Opus, Sonnet та Haiku

Айтівець влаштував іспит чотирьом LLM на реальних даних. Ось, що з цього вийшло