Тільки вчора ми писали про запуск функції ШІ-перекладу в ChatGPT, і ось головний конкурент OpenAI — Google — представив свою новинку. 

Читайте также: Співзасновник LinkedIn подарував альбом з ШІ-музикою своїм друзям на Різдво

TranslateGemma доступна у версіях на 4, 12 та 27 мільярдів параметрів. За даними Google, модель 12B перевершує базову модель Gemma 3 27B за результатами бенчмарку WMT24++. Для розробників така продуктивність моделі, що має вдвічі менше параметрів, означає вищу пропускну здатність та нижчу затримку без втрати точності.

У Google зазначають, що модель 4B оптимізована для роботи на мобільних пристроях, тоді як версія 12B ідеально підходить для споживчих ноутбуків. Натомість потужна модель 27B потребує серйозніших ресурсів, наприклад, одного графічного процесора NVIDIA H100 у хмарі.

Тести на бенчмарку для перекладу зображень Vistra показали, що TranslateGemma краще перекладає текст на картинках, хоча її не навчали спеціально для цього завдання, пише Neowin.

Читайте также: У лютому MacPaw закриває свій альтернативний магазин застосунків для iOS в ЄС

У Google пояснили, що такої продуктивності далося досягти завдяки спеціалізованому двоетапному процесу. На першому етапі було застосовано навчання з учителем (Supervised Fine-Tuning): базові моделі Gemma 3 тренували на суміші текстів, перекладених людьми, та високоякісних синтетичних даних, згенерованих моделями Gemini.

Після цього було реалізовано фазу навчання з підкріпленням. На цьому другому етапі використовувалася група моделей винагород, включаючи розширені показники, такі як MetricX-QE та AutoMQM, щоб спрямувати моделі до більш природних та контекстно точних перекладів.

Моделі TranslateGemma доступні для завантаження на Kaggle та Hugging Face.

https://dev.ua/news/google-predstavyla-translategemma-nove-simeistvo-modelei-dlia-perekladu-1768569086

Читайте также: У «Резерв+» розпочалося тестування постановки на військовий облік для осіб 18–24 років. Як взяти участь

От admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *