Компанія також поділилася статистикою незалежних бенчмарків — зокрема тесту Humanity’s Last Exam, — які продемонстрували значно кращі результати моделі порівняно з її попередньою версією.
Читайте также: Олександр Колб залишає посаду CEO Promodo: компанію тепер очолить Антон Поліщук
Gemini 3.1 Pro також отримала схвальну оцінку від Брендана Фуді, генерального директора ШІ-стартапу Mercor, чия система тестування APEX розроблена для оцінки того, наскільки добре нові моделі ШІ справляються з реальними професійними завданнями.
«Gemini 3.1 Pro наразі очолює рейтинг APEX-Agents», — зазначив Фуді в дописі у соцмережах, додавши, що вражаючі результати моделі свідчать про те, «як швидко агенти вдосконалюються у виконанні реальної інтелектуальної роботи.
«Базуючись на серії Gemini 3, версія 3.1 Pro представляє крок вперед у фундаментальних логічних міркуваннях. 3.1 Pro — це розумніша та потужніша база для розв’язання складних завдань, що підтверджується нашим прогресом у суворих бенчмарках. У тесті ARC-AGI-2, який оцінює здатність моделі розпізнавати абсолютно нові логічні патерни, 3.1 Pro продемонструвала верифікований результат 77,1%. Це більш ніж удвічі перевищує показники логічного мислення моделі 3 Pro», – говориться у блозі компанії.
Читайте также: «400 карбованців. Не повірите, айтівці існували ще до мамонтів». ІТ-фахівці згадують у Threads свою першу зарплату
З четверга Gemini 3.1 Pro у додатку Gemini стає доступною з розширеними лімітами для користувачів тарифних планів Google AI Pro та Ultra. Також модель 3.1 Pro тепер доступна в NotebookLM для передплатників Pro та Ultra. Розробники та підприємства вже можуть отримати доступ до попередньої версії 3.1 Pro через Gemini API у Google AI Studio, Antigravity, Vertex AI, Gemini Enterprise, Gemini CLI та Android Studio.
Нагадаємо, що минулого тижня Google випустила оновлену модель Gemini 3 Deep Think для науковців, дослідників та інженерів.
https://dev.ua/news/nova-model-google-gemini-pro-znovu-vstanovyla-rekordni-pokaznyky-v-benchmarkakh
Читайте также: TAF Industries розраховує, що за відсутності ризиків виробництво в Німеччині найближчим часом буде більшим, ніж в Україні
