У OpenAI повідомили, що ChatGPT Images 2.0 став новою версією інструмента генерації зображень у ChatGPT. Модель орієнтована на створення складних візуальних матеріалів (від постерів і презентацій до коміксів і UI-макетів) із точнішим дотриманням заданих параметрів.
Читайте также: До 30 000 USDT і техніка Apple: OKX оголосила весняну P2P-акцію
За даними компанії, ключове оновлення — покращене відтворення тексту на зображеннях. Раніше генератори часто спотворювали написи або робили їх нечіткими, тепер модель здатна точніше формувати дрібні текстові елементи, підписи та інтерфейсні компоненти навіть у складних композиціях.
OpenAI також заявляє про кращу роботу з різними мовами, зокрема не латинськими системами письма. Це означає, що модель має точніше відтворювати текст японською, корейською, хінді та іншими мовами, де попередні версії часто припускалися помилок.
Ми протестували нові можливості генератора зображень, попросивши його згенерувати інфографіку офіційно зареєстрованих IT-компаній в Україні на кінець 2025 року. Ось що з цього вийшло:
Як бачите, Images 2.0 значно краще справляється з будь яким текстом українською мовою та навіть дрібним шрифтом.
Ще одна зміна — поява режиму з «thinking», у якому модель може витрачати більше часу на підготовку результату. У цьому режимі система аналізує запит, уточнює структуру зображення і лише після цього генерує фінальний варіант. Такий підхід використовується для складних задач, наприклад багатокадрових коміксів або маркетингових матеріалів із кількома елементами.
Читайте также: Марсохід Curiosity вперше виявив на Марсі органічні сполуки, подібні до ДНК
Окрім цього, OpenAI додала можливість створювати кілька варіантів зображень із одного запиту, а також підтримку різних форматів і розмірів для підготовки графіки під конкретні платформи.
Для розробників компанія відкрила доступ до моделі через API під назвою gpt-image-2. Вона підтримує генерацію, редагування зображень і роботу з різними роздільними здатностями, включно з більш деталізованими варіантами.
ChatGPT Images 2.0 є наступним кроком розвитку генерації зображень у продуктах OpenAI після попередніх моделей, які працювали на дифузійних підходах. У компанії наголошують, що нова система краще справляється зі складними сценами, дрібними деталями та текстом — саме ці елементи раніше найчастіше створювали проблеми для генеративних моделей. Новий інструмент уже доступний у ChatGPT і через API для розробників.
Раніше dev.ua писав про те, як OpenAI презентувала GPT-Rosalind — свою першу спеціалізовану модель ШІ, орієнтовану на науковий сектор. Новинка здатна до складних логічних міркувань у сфері біомедичних досліджень.
Читайте также: Microsoft знизила ціну ігрових підписок. Ціна PC Game Pass в Україні подешевшала на 60 грн
