Anthropic випустила Claude Opus 4.7: модель краще пише код і обробляє зображення

Як повідомляє Anthropic, модель уже доступна в Claude, API, а також у Amazon Bedrock, Google Vertex AI і Microsoft Foundry. Вартість залишилась без змін — $5 за мільйон вхідних токенів і $25 за мільйон вихідних.

У програмуванні модель реально додала. У тесті SWE-bench Pro вона набрала 64,3% проти 53,4% у попередньої версії. У більш точній перевірці цих же задач результат становить 87,6%. В іншому тесті для роботи з терміналом модель показала 69,4%.

Прогрес підтверджують і компанії. GitHub зафіксував приріст приблизно на 13% у наборі з 93 задач. У Notion кажуть про +14% продуктивності та значно менше збоїв. У CursorBench результат зріс до 70% проти 58%. Rakuten повідомляє, що модель вирішує утричі більше реальних задач, а у Vercel відзначили нову поведінку — перед написанням коду модель намагається перевірити, чи рішення взагалі правильне.

У задачах, де треба аналізувати інформацію і ухвалювати рішення, модель теж покращилась. Наприклад, у тесті GDPval-AA вона набрала 1753 бали проти 1619 у попередньої версії. У фінансових сценаріях результат становить 64,4%.

Покращили і роботу із зображеннями. Тепер модель обробляє картинки до 2576 пікселів по довгій стороні. Це приблизно утричі більше, ніж раніше, і дозволяє нормально працювати зі складними схемами, таблицями і скриншотами.

Anthropic також додала новий рівень «глибини роботи» під назвою xhigh. Це означає, що модель може довше думати над задачею і давати точніші відповіді. У Claude Code цей режим тепер увімкнений за замовчуванням.

Серед нових інструментів — команда /ultrareview, яка перевіряє код і знаходить помилки перед запуском. Також з’явився механізм, який дозволяє контролювати, скільки ресурсів модель витрачає на довгі задачі.

Водночас є нюанс із ціною. Хоча тариф не змінився, новий спосіб обробки тексту означає, що один і той самий запит може використовувати на 1,0-1,35 раза більше токенів. Крім того, якщо модель довше «думає», вона витрачає більше ресурсів.

Opus 4.7 — це не найсильніша модель Anthropic. Вище знаходиться Claude Mythos Preview, але вона поки що доступна обмежено. У новій версії компанія спеціально обмежила частину можливостей, пов’язаних із кібербезпекою, і додала автоматичні фільтри для небезпечних запитів. Це означає, що Anthropic тестує захисти на доступнішій моделі перед тим, як відкривати більш потужні.

Раніше dev.ua писав про те, як Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл скликали цього тижня екстрену зустріч із керівниками банків, щоб попередити їх про ризики для кібербезпеки, які несе нова модель штучного інтелекту компанії Anthropic.

Anthropic випустила Claude Opus 4.7: модель краще пише код і обробляє зображення

Відadmin

Від admin

Пов’язаний запис

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Залишити відповідь Скасувати коментар

Ви пропустили

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Фішингова атака від імені «Нової пошти»: шахраї надсилають листи про «податкові перевірки»