Mistral випустила ШІ-модель з відкритим кодом для генерації мовлення: може поміститися на смартгодиннику та смартфоні

Нова модель під назвою Voxtral TTS підтримує 9 мов: англійську, французьку, німецьку, іспанську, голландську, португальську, італійську, хінді та арабську.

«Наші клієнти давно просили модель для генерації мовлення. Тому ми розробили компактну модель, яка здатна працювати на смартгодинниках, смартфонах, ноутбуках та інших периферійних пристроях. Її вартість становить лише малу частку від будь-яких аналогів на ринку, але при цьому вона забезпечує передову продуктивність», — розповів П’єр Сток, віцепрезидент із наукових операцій Mistral AI, для TechCrunch.

Mistral заявила, що нова модель може адаптувати власний голос із семплом менше п’яти секунд та вловлювати такі характеристики, як ледь помітні акценти, інтонації, логічні наголоси та індивідуальні особливості темпу мовлення.

Модель, побудована на базі Ministral 3B, може легко перемикатися між мовами, зберігаючи унікальні риси голосу, що надзвичайно корисно для дубляжу або синхронного перекладу. Сток підкреслив, що компанія прагнула досягти природного людського звучання, а не механічного «голосу робота».

За даними компанії, модель розроблена для роботи в режимі реального часу. Показник Time-to-First-Audio (TTFA) — час до початку «мовлення» після отримання вхідних даних — становить 90 мс для 10-секундного зразка обсягом 500 символів. Модель також має коефіцієнт реального часу (RTF) 6x, що означає здатність згенерувати 10-секундний аудіо кліп приблизно за 1,6 секунди.

Mistral випустила ШІ-модель з відкритим кодом для генерації мовлення: може поміститися на смартгодиннику та смартфоні

Відadmin

Від admin

Пов’язаний запис

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Залишити відповідь Скасувати коментар

Ви пропустили

Amazon проводить скорочення у підрозділі загального штучного інтелекту

Український стартап Zibra AI показав свою технологію стиснення анімованої геометрії ZibraGDS в США

ІТ-компанія Liven, що входить до складу SKELAR, скорочує 15% співробітників

Фішингова атака від імені «Нової пошти»: шахраї надсилають листи про «податкові перевірки»