Як пишуть у блозі Google, 3.1 Flash-Lite починає розгортатися в режимі preview для розробників через Gemini API в Google AI Studio та для корпоративних клієнтів через Vertex AI. Компанія заявляє, що модель орієнтована на роботу «в масштабі», коли важливі низька затримка відповіді та контроль витрат.
Google одразу підкреслює ціну: $0,25 за 1 млн вхідних токенів і $1,50 за 1 млн вихідних. У блозі це подають як аргумент для сценаріїв, де потрібно обробляти великі обсяги коротких запитів без помітного просідання якості, наприклад у високочастотній модерації, класифікації чи масовому перекладі.
Ще один акцент — швидкість. За даними бенчмарку Artificial Analysis, 3.1 Flash-Lite має у 2,5 раза швидший Time to First Answer Token порівняно з Gemini 2.5 Flash і приблизно на 45% більшу швидкість генерації. Google підкреслює, що така низька затримка критична для сервісів «у реальному часі», де користувач чекає відповідь одразу.
У компанії також наводять бенчмарки якості й порівняння з моделями схожого класу. Зокрема, Flash-Lite отримала Elo 1432 в Arena.ai Leaderboard, показала 86,9% у GPQA Diamond і 76,8% у MMMU Pro. Окремо Google підкреслює, що модель може працювати з мультимодальними задачами та інструкціями, а не лише з простими класифікаціями.
Щоб розробники могли підлаштовувати баланс між швидкістю, ціною й точністю, 3.1 Flash-Lite в AI Studio та Vertex AI має налаштування thinking levels — можливість обирати, наскільки «глибоко» модель має опрацьовувати завдання. У Google кажуть, що це допомагає керувати витратами в масових сценаріях і водночас піднімати якість там, де потрібно більше міркувань, наприклад під час генерації інтерфейсів, дашбордів або симуляцій.
Читайте также: Український дрон Raybird отримав сенсор радіації і пройшов випробування в Чорнобильській зоні
Google також згадує, що ранні користувачі AI Studio та Vertex AI, а також компанії Latitude, Cartwheel і Whering вже тестують 3.1 Flash-Lite у своїх продуктах і відзначають поєднання швидкості з «дорослішими» можливостями в інструкціях та міркуваннях.
Раніше dev.ua писав про те, як компанія Google представила оновлену версію своєї популярної моделі для створення зображень — Nano Banana 2. Нова модель, яка технічно є частиною Gemini 3.1 Flash Image, здатна створювати значно реалістичніші зображення, ніж її попередниця.
Читайте также: GoIT створила освітню екосистему BetterED, яка об’єднала чотири EdTech бренди
