«Моделі, які ми запускаємо, переносять аудіо в реальному часі від простого виклику та відповіді до голосових інтерфейсів, які дійсно можуть працювати: слухати, міркувати, перекладати, транскрибувати та вживати інших заходів у процесі розмови», — зазначила компанія у своєму блозі з нагоди представлення моделей.

Читайте также: Акція завершилась, але полювання триває. Власний досвід бартеру: як обмінюватися картками S.T.A.L.K.E.R. 2 з іншими сталкерами

При цьому GPT‑Realtime‑2 названа першою голосовою моделлю із системою міркування класу GPT‑5, яка може обробляти складні запити та природно вести розмову.

GPT‑Realtime‑Translate є новою моделлю для живого перекладу, яка може перекладати мовлення користувачів з понад 70 мов введення на 13 мов виведення, не відстаючи при цьому від самого мовця.

У свою чергу, GPT‑Realtime‑Whisper містить нові потокові функції перетворення мовлення на текст, і транскрибує мовлення в режимі реального часу під час розмови мовця.

«Оскільки голос стає більш природним способом використання програмного забезпечення, ми бачимо, як розробники будують свої продукти навколо трьох нових моделей голосового штучного інтелекту», — кажуть у OpenAI. 

Читайте также: Хто успадкував бізнес OnlyFans після смерті Леоніда Радвінського. Що про це відомо

За інформацією компанії, аудіомоделі вже тестуються великим бізнесом — серед клієнтів онлайн-майданчик нерухомості Zillow, ⁠онлайн-турагентство Priceline та телекомунікаційна компанія Deutsche Telekom. 

Ціна на GPT-Realtime-2 починається від $32 за мільйон токенів аудіо вхідного зв’язку, користування GPT-Realtime-Translate коштує $0,034 за хвилину, а GPT-Realtime-Whisper — $0,017 за хвилину.

Напередодні dev.ua також повідомляв, що OpenAI оновила дефолтну модель ChatGPT: GPT-5.5 Instant галюцинує на 52% рідше і відповідає коротше. 

Читайте также: Анджелина Джоли В Молодости: начало пути к мировой славе

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *