Як зазначається у блозі Anthropic, дана модель може «будувати плани», сама використовувати браузери та термінали, і «працювати автономно на рівні, який лише кілька місяців тому вимагав більших і дорожчих моделей».

Читайте также: Парк роботизованих систем «Нової пошти» перевищив 800 одиниць і подвоїться до кінця року

Компанія зазначає, що Claude Sonnet 5 в плані агентних можливостей наближається до моделей класу Opus.

«Sonnet 5 скорочує розрив: його продуктивність близька до Opus 4.8, але за нижчою ціною. Це суттєве покращення порівняно з попередником, Sonnet 4.6, у важливих аспектах агентної продуктивності», — стверджують у Anthropic. 

Там навели таблицю показників Claude Sonnet 5 порівняно з іншими моделями. 

Зазначається, що Claude Sonnet 5 віднині доступний для всіх планів. Це модель за замовчуванням для планів Free та Pro, а також вона доступна для користувачів Max, Team та Enterprise. 

«Він також доступний у Claude Code та на платформі Claude, де його початкова ціна становить $2 за мільйон вхідних токенів та $10 за мільйон вихідних токенів до 31 серпня 2026 року, після чого його ціна становитиме $3 за мільйон вхідних токенів та $15 за мільйон вихідних токенів. 

Розробники можуть використовувати Claude Sonnet 5 через Claude API.

Як додають у ШІ-гіганті, попередня найкраща модель Sonnet (Sonnet 4.6) значно відставала від Opus 4.8, тепер же Sonnet 5 та Opus 4.8 охоплюють один діапазон, причому Sonnet 5 пропонує «вражаючі можливості за нижчою ціною, а Opus 4.8 пропонує більшу точність за вищою ціною». 

Читайте также: Компанія «Генерал Черешня» придбала на аукціоні конфісковану квартиру пропагандиста Артємія Лєбєдєва. З якою метою?

Що стосується агентної безпеки, то модель, за даними компанії, краще відхиляє шкідливі запити та протистоїть «спробам захоплення». Також модель демонструє нижчі показники галюцинацій та «підлабузництва», ніж Sonnet 4.6. 

Sonnet 5 демонструє загалом нижчий рівень неправильної поведінки, ніж Sonnet 4.6, хоча вищий, ніж Mythos Preview та Opus 4.8.

Відносно використання цієї моделі для задач з кібербезпеки компанія повідомила, що навмисно не навчала Sonnet 5 цим завданням, хоча вона «може виконувати деякі рутинні, нешкідливі кіберзавдання». Втім, у розробці програмних експлойтів модель показує значно гіршу продуктивність, ніж Opus 4.8 та Mythos 5. 

Як повідомляв dev.ua, компанія OpenAI представила три нові моделі включно з флагманською Sol. Втім, відповідно до нових вимог адміністрації Трампа, вони нині перебувають у «обмеженому попередньому перегляді».  

Читайте также: В OpenAI пояснили, чому Codex «спалював» кредити швидше, ніж зазвичай, і заявили, що проблему вже усунули

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *