Як повідомляє Anthropic, модель наразі доступна лише обмеженому колу партнерів у межах окремої програми. Серед них — великі технологічні компанії та організації, які відповідають за стабільну роботу інтернет-інфраструктури. У компанії пояснюють це тим, що можливості Mythos можуть становити ризик, якщо їх отримають зловмисники.
Читайте также: Технічна помилка ТЦК: у Міноборони пояснили, чому жінки отримували статус «в розшуку» у «Резерв+»
Під час тестів модель продемонструвала здатність знаходити тисячі вразливостей у популярному програмному забезпеченні, включно з операційними системами та веббраузерами. У деяких випадках вона не просто вказувала на проблему, а одразу пропонувала, як її використати для атаки. Зокрема, як заявляють у компанії, модель змогла виявити стару вразливість в OpenBSD, яка залишалася непоміченою десятиліттями.
Також дослідники зазначають, що навіть без глибоких знань у кібербезпеці користувачі могли отримувати від моделі робочі сценарії атак — достатньо було правильно сформулювати запит. Це, за оцінкою Anthropic, суттєво знижує поріг входу для потенційних зловмисників.
У компанії наголошують, що спеціально не навчали Mythos для проведення атак. Такі можливості з’явилися як побічний ефект розвитку моделі, яка стала краще працювати з кодом, логікою та складними задачами. Саме це і стало причиною обмеження доступу.
Читайте также: Українські дрони-перехоплювачі вже збивають іранські «шахеди» у Перській затоці — Зеленський
Разом із запуском програми обмеженого доступу Anthropic пообіцяла надати значні ресурси для фахівців з кібербезпеки та відкритих проєктів, щоб допомогти швидше знаходити і закривати вразливості. У компанії прямо визнають, що нове покоління ШІ вже здатне змінити баланс у кібербезпеці — і не лише на користь захисту, а й потенційно для атак.
Раніше dev.ua писав про те, як Anthropic заявила, що її модель Claude не відчуває емоцій у людському сенсі, але внутрішні уявлення про них можуть напряму впливати на вибір дій, зокрема в ризикованих сценаріях.
Читайте также: Хакер з Північної Кореї «підірвав» вірус на власному ПК, викривши схему фейкових ІТ-працівників із доходом $1 млн на місяць
