«Сбер» представил обновленную модель для работы с изображениями Kandinsky 6.0 Image, интегрированную в ИИ-помощник «ГигаЧат». Она используется для создания и редактирования изображений в веб-версии, мобильном приложении и мессенджерах. Об этом Sostav сообщили в пресс-службе компании.
По данным разработчика, в новой версии увеличена скорость обработки запросов и улучшено понимание сложных текстовых инструкций. Добавлены инструменты для реставрации старых фотографий, смены одежды и фона, ретуши, макияжа, а также стилизации изображений под разные визуальные форматы.
Как пояснили в «Сбере», модель стала точнее выполнять точечные правки изображений, например, изменение отдельных элементов без затрагивания остального кадра. Также снижено количество ошибок при генерации сложных сцен, включая изображения с большим числом объектов и людей. Для работы с актуальными объектами используется поиск по изображениям (Image RAG), позволяющий находить визуальные референсы.
Kandinsky 6.0 Image построена на архитектуре Mixture of Experts (MoE), при которой для обработки запроса активируются отдельные специализированные блоки модели. Такой подход снижает нагрузку на вычисления и позволяет разделять функции внутри системы для обработки разных типов задач.
Ранее аналитики «Анкетолога» выяснили, что 80% россиян хотя бы раз не смогли отличить сгенерированное нейросетью изображение от реального фото.
