Як пишуть у блозі Google, 3.1 Flash-Lite починає розгортатися в режимі preview для розробників через Gemini API в Google AI Studio та для корпоративних клієнтів через Vertex AI. Компанія заявляє, що модель орієнтована на роботу «в масштабі», коли важливі низька затримка відповіді та контроль витрат.

Читайте также: «На сьогодні відповідна законодавча ініціатива не надходила». Свириденко відповіла на петицію щодо введення ПДВ для ФОПів. Які подробиці відомі

Google одразу підкреслює ціну: $0,25 за 1 млн вхідних токенів і $1,50 за 1 млн вихідних. У блозі це подають як аргумент для сценаріїв, де потрібно обробляти великі обсяги коротких запитів без помітного просідання якості, наприклад у високочастотній модерації, класифікації чи масовому перекладі.

Ще один акцент — швидкість. За даними бенчмарку Artificial Analysis, 3.1 Flash-Lite має у 2,5 раза швидший Time to First Answer Token порівняно з Gemini 2.5 Flash і приблизно на 45% більшу швидкість генерації. Google підкреслює, що така низька затримка критична для сервісів «у реальному часі», де користувач чекає відповідь одразу.

У компанії також наводять бенчмарки якості й порівняння з моделями схожого класу. Зокрема, Flash-Lite отримала Elo 1432 в Arena.ai Leaderboard, показала 86,9% у GPQA Diamond і 76,8% у MMMU Pro. Окремо Google підкреслює, що модель може працювати з мультимодальними задачами та інструкціями, а не лише з простими класифікаціями.

Щоб розробники могли підлаштовувати баланс між швидкістю, ціною й точністю, 3.1 Flash-Lite в AI Studio та Vertex AI має налаштування thinking levels — можливість обирати, наскільки «глибоко» модель має опрацьовувати завдання. У Google кажуть, що це допомагає керувати витратами в масових сценаріях і водночас піднімати якість там, де потрібно більше міркувань, наприклад під час генерації інтерфейсів, дашбордів або симуляцій.

Читайте также: Український дрон Raybird отримав сенсор радіації і пройшов випробування в Чорнобильській зоні

Google також згадує, що ранні користувачі AI Studio та Vertex AI, а також компанії Latitude, Cartwheel і Whering вже тестують 3.1 Flash-Lite у своїх продуктах і відзначають поєднання швидкості з «дорослішими» можливостями в інструкціях та міркуваннях.

Раніше dev.ua писав про те, як компанія Google представила оновлену версію своєї популярної моделі для створення зображень — Nano Banana 2. Нова модель, яка технічно є частиною Gemini 3.1 Flash Image, здатна створювати значно реалістичніші зображення, ніж її попередниця.

https://dev.ua/news/google-vypustyla-gemini-31-flash-lite-naishvydshu-i-naideshevshu-model-u-liniitsi-gemini-3-1772621749

Читайте также: GoIT створила освітню екосистему BetterED, яка об’єднала чотири EdTech бренди

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *