Anthropic представила «найбільш агентну модель» з усіх існуючих в цій лінійці. Що може Claude Sonnet 5

Як зазначається у блозі Anthropic, дана модель може «будувати плани», сама використовувати браузери та термінали, і «працювати автономно на рівні, який лише кілька місяців тому вимагав більших і дорожчих моделей».

Компанія зазначає, що Claude Sonnet 5 в плані агентних можливостей наближається до моделей класу Opus.

«Sonnet 5 скорочує розрив: його продуктивність близька до Opus 4.8, але за нижчою ціною. Це суттєве покращення порівняно з попередником, Sonnet 4.6, у важливих аспектах агентної продуктивності», — стверджують у Anthropic.

Там навели таблицю показників Claude Sonnet 5 порівняно з іншими моделями.

Зазначається, що Claude Sonnet 5 віднині доступний для всіх планів. Це модель за замовчуванням для планів Free та Pro, а також вона доступна для користувачів Max, Team та Enterprise.

«Він також доступний у Claude Code та на платформі Claude, де його початкова ціна становить $2 за мільйон вхідних токенів та $10 за мільйон вихідних токенів до 31 серпня 2026 року, після чого його ціна становитиме $3 за мільйон вхідних токенів та $15 за мільйон вихідних токенів.

Розробники можуть використовувати Claude Sonnet 5 через Claude API.

Як додають у ШІ-гіганті, попередня найкраща модель Sonnet (Sonnet 4.6) значно відставала від Opus 4.8, тепер же Sonnet 5 та Opus 4.8 охоплюють один діапазон, причому Sonnet 5 пропонує «вражаючі можливості за нижчою ціною, а Opus 4.8 пропонує більшу точність за вищою ціною».

Що стосується агентної безпеки, то модель, за даними компанії, краще відхиляє шкідливі запити та протистоїть «спробам захоплення». Також модель демонструє нижчі показники галюцинацій та «підлабузництва», ніж Sonnet 4.6.

Sonnet 5 демонструє загалом нижчий рівень неправильної поведінки, ніж Sonnet 4.6, хоча вищий, ніж Mythos Preview та Opus 4.8.

Відносно використання цієї моделі для задач з кібербезпеки компанія повідомила, що навмисно не навчала Sonnet 5 цим завданням, хоча вона «може виконувати деякі рутинні, нешкідливі кіберзавдання». Втім, у розробці програмних експлойтів модель показує значно гіршу продуктивність, ніж Opus 4.8 та Mythos 5.

Як повідомляв dev.ua, компанія OpenAI представила три нові моделі включно з флагманською Sol. Втім, відповідно до нових вимог адміністрації Трампа, вони нині перебувають у «обмеженому попередньому перегляді».

Anthropic представила «найбільш агентну модель» з усіх існуючих в цій лінійці. Що може Claude Sonnet 5

Відadmin

Від admin

Пов’язаний запис

Згенерує зображення за 4 секунди: Google представила Nano Banana 2 Lite для швидкої роботи з великим обсягом контенту

Полк БПС «Лава» у складі «Хартії» шукає айтівців у команду ISTAR. Які ще фахівці потрібні

«Нам вдалося поєднати експертизу лікаря та можливості ШІ». Анатолій Рогальський оголосив про початок бета-тестування health-tech застосунку Jane

Залишити відповідь Скасувати коментар

Ви пропустили

Згенерує зображення за 4 секунди: Google представила Nano Banana 2 Lite для швидкої роботи з великим обсягом контенту

Полк БПС «Лава» у складі «Хартії» шукає айтівців у команду ISTAR. Які ще фахівці потрібні

«Нам вдалося поєднати експертизу лікаря та можливості ШІ». Анатолій Рогальський оголосив про початок бета-тестування health-tech застосунку Jane

Влада США зняла обмеження на Mythos та Fable. Передові моделі Anthropic відсьогодні знову будуть доступні користувачам