21 апреля 2026 года OpenAI выпустила ChatGPT Images 2.0 — нового флагмана генерации изображений на движке gpt-image-2. Это не косметическое обновление: впервые модель «думает» перед тем, как рисовать, воспроизводит текст почти без ошибок и закрывает задачи, которые раньше требовали отдельного дизайнера. Разбираем, что изменилось, как это работает и стоит ли переходить.
Прямой доступ к Чат ГПТ требует зарубежного IP-адреса и иностранной карты. Через Study AI ChatGPT Images 2.0 доступен напрямую через оплату картами Сбербанка, Тинькофф, ВТБ и других российских банков. В одном аккаунте — 50+ нейросетей: Midjourney, Flux, Claude и другие. Регистрация занимает минуту!
К апрелю 2026 года рынок генерации изображений выглядел примерно так: Google с серией Nano Banana (Gemini Flash Image) удерживала первое место в LM Arena по метрике text-to-image, OpenAI отвечала gpt-image-1.5 — сильной, но явно догоняющей моделью. DALL-E 2 и DALL-E 3 уходят в историю: OpenAI объявила об их отключении 12 мая. Одновременно компания закрыла Sora — видеогенератор, который так и не стал массовым продуктом.
На этом фоне Images 2.0 — это не просто апдейт. Это заявка OpenAI на то, что визуальный контент становится таким же базовым форматом взаимодействия с AI, как текст. Сам OpenAI формулирует это так:
«Изображения — это язык, а не декорация. Хорошее изображение делает то же, что хорошее предложение: выбирает, расставляет и раскрывает.»
ChatGPT Images 2.0 — это продуктовая оболочка, под которой работает модель gpt-image-2. OpenAI не раскрыла архитектурные детали: представитель компании отказался подтвердить, диффузионная это модель или авторегрессивная. Известно лишь, что это «генералистская модель» — по аналогии с GPT для текста — способная обрабатывать пространственные отношения и трёхмерную перспективу через текстовые инструкции.
Ключевое нововведение — интеграция O-серии reasoning-возможностей прямо в процесс генерации изображений. Это первая модель OpenAI для изображений с нативным мышлением: перед тем как что-то нарисовать, она анализирует задачу, проверяет себя и при необходимости ищет референсы в интернете. Knowledge cutoff модели — декабрь 2025 года.
Два режима работы:
Это то, чего ждали годами. Все диффузионные модели исторически «врали» в тексте: неправильные буквы, расплывчатые слова, откровенная абракадабра. Images 2.0 решает эту проблему системно — точность воспроизведения текста, по данным предрелизных тестов, превысила 99%.
Журналист TechCrunch Аманда Зильберлинг попросила модель сгенерировать меню мексиканского ресторана и получила результат, который, по её словам, можно немедленно отдавать в печать — ни одной ошибки в названиях блюд. Для сравнения: то же задание в DALL-E 3 два года назад выдавало блюда с именами вроде «энчуита», «чурирос» и «бурто».
Поддерживаются латиница, кириллица, иероглифы CJK (китайский, японский, корейский), хинди, бенгальский и другие нелатинские алфавиты. Текст теперь выглядит нативно встроенным в дизайн, а не наклеенным сверху.
Images 2.0 — первая модель OpenAI, способная генерировать полноценные страничные макеты: обложки журналов с заголовками и штрихкодами, инфографику с легендами и подписями, слайды с несколькими текстовыми блоками, постеры с правильной иерархией.
VentureBeat, получивший ранний доступ, отметил, что модель справляется с картами, слайдами, инфографикой и мангой «практически безупречно» — и является одной из двух моделей (вторая — Nano Banana 2), способных точно воспроизвести карту с границами цивилизаций ацтеков, майя и инков с читаемой легендой.
Одна из самых практически важных фич — пакетная генерация. Единый промпт возвращает несколько вариантов, которые разделяют одну композицию и палитру. По словам представителей OpenAI, это решает «громоздкий» рабочий процесс, при котором раньше нужно было промптить каждое изображение отдельно, а потом вручную подбирать совместимые. Теперь это работает из коробки — и открывает нормальный итерационный цикл для дизайнеров.
Режим Thinking добавляет к этому character consistency: персонажи, объекты и стилистика сохраняются между кадрами. Это основа для последовательных нарративов — комиксов, детских книг, сторибордов.
Максимальное разрешение — 2000 пикселей по длинной стороне. Поддерживаются соотношения сторон от 3:1 до 1:3: широкоформатные баннеры, вертикальные сторис, нестандартные форматы — всё без постобработки.
Редактор ZDNET Дэвид Гевирц, получивший превью за день до релиза, отметил, что это решает одну из самых раздражающих проблем предыдущих версий: Чат ГПТ раньше упрямо генерировал то соотношение сторон, которое хотел сам, игнорируя инструкции.
В режиме Thinking модель может обращаться к интернету прямо во время работы — искать актуальные данные, подтягивать визуальные референсы, проверять фактическую точность диаграмм. Это критично для задач, где эстетика неотделима от достоверности: образовательные материалы, аналитические дашборды, технические иллюстрации.
Images 2.0 работает внутри Codex — среды разработки OpenAI. Разработчики могут генерировать UI-макеты, прототипы интерфейсов и иллюстрации прямо в своём рабочем пространстве, не переключаясь между инструментами. Доступно через существующую подписку ChatGPT, без отдельного API-ключа.
Маркетинг и SMM.
Баннеры, обложки, сторис с читаемым текстом — без дизайнера. Пакетная генерация сразу выдаёт несколько вариантов для A/B теста. Скорость производства контента меняется кардинально.
Редакционный дизайн.
Обложки журналов, полосы, инфографика для статей. Модель воспроизводит сложные лайауты с несколькими уровнями текста — то, что раньше было уделом опытных верстальщиков.
Образование.
Диаграммы, схемы, иллюстрации к учебным материалам с правильными подписями и данными. Thinking Mode особенно полезен здесь — модель проверяет фактическую точность до финального рендера.
Комиксы, сторибординг, визуальное повествование.
Character consistency в режиме Thinking делает последовательные нарративы реальностью: один и тот же персонаж узнаваем от кадра к кадру. Это открывает двери для создателей веб-комиксов и аниматоров на этапе препродакшна.
Разработка продуктов.
UI-скетчи, мокапы экранов, иллюстрации для онбординга — прямо в Codex, без переключения инструментов.
E-commerce.
Продуктовые изображения, инфографика характеристик, упаковка — с точным воспроизведением текста бренда.
«ChatGPT Images 2.0 — первая модель от OpenAI и одна из двух (вторая — Nano Banana 2), которая может точно воспроизвести карту с границами ацтекской, майяской и инкской цивилизаций с полностью читаемой легендой.» — VentureBeat
«Если считать DALL-E пещерными рисунками, а Images 1.0 — древним искусством, то Images 2.0 — это Ренессанс.» — The Decoder
«Меню мексиканского ресторана получилось таким, что можно немедленно пустить в дело — посетители не заметят, что оно сгенерировано ИИ.» — TechCrunch
Модель прошла тест, который конкуренты проваливали годами: гиперреалистичная DSLR-фотография лошади верхом на астронавте в качестве «седла». В режиме Thinking результат получился с убедительной DSLR-эстетикой.
Критика тоже есть. Блогер Handy AI указал на конкретный провал: в демо-карте мира модель придумала несуществующие страны («Ciger», «Mharee») и переместила Найроби в Саудовскую Аравию. То есть Thinking Mode — не гарантия фактической точности, а инструмент, который надо проверять. Редактор ZDNET столкнулся с тем, что модель не смогла воспроизвести логотип издания: подтянула устаревшую версию и сдвинула элементы за край кадра.
Разработчики отметили, что ключевые возможности — Thinking, веб-поиск, пакетная генерация — заперты за платной подпиской. Бесплатные пользователи получают лучшую базовую модель, но не лучший опыт.
Есть и более острая дискуссия: модель генерирует фотореалистичные скриншоты интерфейсов, поддельные новостные страницы и фейковые посты в соцсетях настолько убедительно, что это вызывает серьёзные опасения насчёт дезинформации. OpenAI добавила C2PA-метаданные и вотермарки, но сам представитель компании признал, что это «не серебряная пуля» — метаданные исчезают при скриншоте или пережатии файла.
С августа 2025 года Google планомерно строила доминирование в сегменте AI-генерации изображений через серию Nano Banana (официально — Gemini Flash Image). Nano Banana 2, вышедшая в феврале 2026 года на базе Gemini 3.1 Flash, стала лидером Artificial Analysis Image Arena и умудрялась сочетать Flash-скорость с качеством Pro-уровня при цене API вдвое ниже предшественника. Images 2.0 — прямой ответ.
Images 2.0 выигрывает там, где нужна точность текста, сложные лайауты, многокадровые нарративы и глубокий анализ промпта. Если вы делаете постеры, инфографику, обложки или комиксы — это лучший выбор на рынке прямо сейчас.
Nano Banana 2 держит позиции по скорости, разрешению до 4K, цене через API и работе с большим количеством референсов. Для высокообъёмных пайплайнов и Google-экосистемы она по-прежнему вне конкуренции.
Это совпадение — не случайное. Images 2.0 вышла сразу после объявления об отключении Sora, и часть аудитории восприняла это как прямую замену. На самом деле всё немного сложнее.
Images 2.0 действительно закрывает значительную часть задач, ради которых пользователи обращались к Sora: раскадровки и сторибординг, визуальные нарративы, препродакшн для видеопроектов, обложки и постеры для видеоконтента. Character consistency в Thinking Mode — прямая альтернатива сторибордингу через видеогенератор.
Но Sora была видеомоделью. Движение, анимация, временна́я последовательность — это принципиально другой класс задач, Images 2.0 их не закрывает. Вероятно, OpenAI работает над следующим видеогенератором — и Images 2.0 заполняет паузу, а не закрывает нишу навсегда.
Стратегически всё выглядит как консолидация: один инструмент (ChatGPT) с мощным текстовым и визуальным движком, без зоопарка отдельных сервисов. Images 2.0 — следующий шаг в этой стратегии.
На момент релиза веб-версия и десктопное приложение получили обновление первыми. Мобильная версия с поддержкой тач-выделения изображений — в процессе роллаута.
ChatGPT Images 2.0 — это реальный сдвиг, а не маркетинговый апдейт. Для дизайнеров, маркетологов и всех, кто работает с текстом внутри изображений, это лучший инструмент на рынке прямо сейчас. Nano Banana 2 выигрывает по скорости и разрешению — но если вам нужна точность и сложные лайауты, Images 2.0 на шаг впереди. Конкуренция между OpenAI и Google в сегменте изображений вошла в острую фазу, и пользователи от этого только выигрывают.