OpenAI випустила ChatGPT Images 2.0 і додала нові можливості генерації зображень у ChatGPT

У OpenAI повідомили, що ChatGPT Images 2.0 став новою версією інструмента генерації зображень у ChatGPT. Модель орієнтована на створення складних візуальних матеріалів (від постерів і презентацій до коміксів і UI-макетів) із точнішим дотриманням заданих параметрів.

За даними компанії, ключове оновлення — покращене відтворення тексту на зображеннях. Раніше генератори часто спотворювали написи або робили їх нечіткими, тепер модель здатна точніше формувати дрібні текстові елементи, підписи та інтерфейсні компоненти навіть у складних композиціях.

OpenAI також заявляє про кращу роботу з різними мовами, зокрема не латинськими системами письма. Це означає, що модель має точніше відтворювати текст японською, корейською, хінді та іншими мовами, де попередні версії часто припускалися помилок.

Ми протестували нові можливості генератора зображень, попросивши його згенерувати інфографіку офіційно зареєстрованих IT-компаній в Україні на кінець 2025 року. Ось що з цього вийшло:

Як бачите, Images 2.0 значно краще справляється з будь яким текстом українською мовою та навіть дрібним шрифтом.

Ще одна зміна — поява режиму з «thinking», у якому модель може витрачати більше часу на підготовку результату. У цьому режимі система аналізує запит, уточнює структуру зображення і лише після цього генерує фінальний варіант. Такий підхід використовується для складних задач, наприклад багатокадрових коміксів або маркетингових матеріалів із кількома елементами.

Окрім цього, OpenAI додала можливість створювати кілька варіантів зображень із одного запиту, а також підтримку різних форматів і розмірів для підготовки графіки під конкретні платформи.

Для розробників компанія відкрила доступ до моделі через API під назвою gpt-image-2. Вона підтримує генерацію, редагування зображень і роботу з різними роздільними здатностями, включно з більш деталізованими варіантами.

ChatGPT Images 2.0 є наступним кроком розвитку генерації зображень у продуктах OpenAI після попередніх моделей, які працювали на дифузійних підходах. У компанії наголошують, що нова система краще справляється зі складними сценами, дрібними деталями та текстом — саме ці елементи раніше найчастіше створювали проблеми для генеративних моделей. Новий інструмент уже доступний у ChatGPT і через API для розробників.

Раніше dev.ua писав про те, як OpenAI презентувала GPT-Rosalind — свою першу спеціалізовану модель ШІ, орієнтовану на науковий сектор. Новинка здатна до складних логічних міркувань у сфері біомедичних досліджень.

OpenAI випустила ChatGPT Images 2.0 і додала нові можливості генерації зображень у ChatGPT

Відadmin

Від admin

Пов’язаний запис

Український розробник створює шутер-компаньйон для робочого столу. Він може отримати варіант локалізації в дусі «згідно-відповідно»

Alphabet збільшує витрати до $205 млрд через ШІ-перегони

Українська Deviro випробовує на фронті новий дешевий дрон-камікадзе «Палиця»

Залишити відповідь Скасувати коментар

Ви пропустили

Український розробник створює шутер-компаньйон для робочого столу. Він може отримати варіант локалізації в дусі «згідно-відповідно»

Alphabet збільшує витрати до $205 млрд через ШІ-перегони

Українська Deviro випробовує на фронті новий дешевий дрон-камікадзе «Палиця»

«Нова пошта» розширила свою мережу в Польщі на 15 000 точок видачі