Як повідомляє Anthropic, модель уже доступна в Claude, API, а також у Amazon Bedrock, Google Vertex AI і Microsoft Foundry. Вартість залишилась без змін — $5 за мільйон вхідних токенів і $25 за мільйон вихідних.

Читайте также: Дефіцит, перепродаж за 2000 грн та ажіотаж. Як відбувається полювання за альманахом S.T.A.L.K.E.R. 2 і де шукати картки, якщо всі вже розкупили

У програмуванні модель реально додала. У тесті SWE-bench Pro вона набрала 64,3% проти 53,4% у попередньої версії. У більш точній перевірці цих же задач результат становить 87,6%. В іншому тесті для роботи з терміналом модель показала 69,4%.

Прогрес підтверджують і компанії. GitHub зафіксував приріст приблизно на 13% у наборі з 93 задач. У Notion кажуть про +14% продуктивності та значно менше збоїв. У CursorBench результат зріс до 70% проти 58%. Rakuten повідомляє, що модель вирішує утричі більше реальних задач, а у Vercel відзначили нову поведінку — перед написанням коду модель намагається перевірити, чи рішення взагалі правильне.

У задачах, де треба аналізувати інформацію і ухвалювати рішення, модель теж покращилась. Наприклад, у тесті GDPval-AA вона набрала 1753 бали проти 1619 у попередньої версії. У фінансових сценаріях результат становить 64,4%.

Покращили і роботу із зображеннями. Тепер модель обробляє картинки до 2576 пікселів по довгій стороні. Це приблизно утричі більше, ніж раніше, і дозволяє нормально працювати зі складними схемами, таблицями і скриншотами.

Anthropic також додала новий рівень «глибини роботи» під назвою xhigh. Це означає, що модель може довше думати над задачею і давати точніші відповіді. У Claude Code цей режим тепер увімкнений за замовчуванням.

Читайте также: Бородатюк закликав українську владу відкласти жорстке регулювання ШІ щонайменше на 10 років

Серед нових інструментів — команда /ultrareview, яка перевіряє код і знаходить помилки перед запуском. Також з’явився механізм, який дозволяє контролювати, скільки ресурсів модель витрачає на довгі задачі.

Водночас є нюанс із ціною. Хоча тариф не змінився, новий спосіб обробки тексту означає, що один і той самий запит може використовувати на 1,0-1,35 раза більше токенів. Крім того, якщо модель довше «думає», вона витрачає більше ресурсів.

Opus 4.7 — це не найсильніша модель Anthropic. Вище знаходиться Claude Mythos Preview, але вона поки що доступна обмежено. У новій версії компанія спеціально обмежила частину можливостей, пов’язаних із кібербезпекою, і додала автоматичні фільтри для небезпечних запитів. Це означає, що Anthropic тестує захисти на доступнішій моделі перед тим, як відкривати більш потужні.

Раніше dev.ua писав про те, як Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл скликали цього тижня екстрену зустріч із керівниками банків, щоб попередити їх про ризики для кібербезпеки, які несе нова модель штучного інтелекту компанії Anthropic.

Читайте также: Диджиталізація інжинірингу: рейтинг лідерів ринку проектування та будівництва під ключ

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *