Sostav.ru
Москва, ул. Полковая 3 стр.3, офис 120
© Sostav независимый проект брендингового агентства Depot
Использование опубликованных материалов доступно только при указании источника.

Дизайн сайта - Liqium

18+
16.01.2023 в 18:12

Безумные руки и «стеклянные» глаза: что до сих пор плохо рисуют нейросети

Подборка проблем в творчестве ИИ — в материале Sostav

2

Бум нейросетей — тренд последних лет, который набрал обороты в конце 2022 года. Искусственный интеллект (ИИ) стал доступен широкому кругу пользователей как возможность генерировать уникальные изображения и иллюстрировать самые безумные фантазии, так что в интернете уже поговаривают о том, что профессия дизайнера изжила себя, ведь технология уже рисует лучше и быстрее. При этом есть несколько проблем, которые создателям нейросетей ещё не удалось решить до конца — Sostav рассказал о них в своём материале.

Безумные руки

Главная причина, по которой пользователи критикуют нейросети, — это неумение рисовать руки. ИИ не усваивает форму человеческой кисти и добавляет лишние пальцы или, наоборот, рисует «лапки динозавра», а также в целом искажает конечности. Иногда нейросети даже дорисовывают лишнюю руку или ногу целиком. Причём стиль рисовки здесь не имеет значения: безумные руки можно увидеть и у реалистичных изображений, и у «мультяшных».

Дело в том, что ИИ не осмысливает референсы с точки зрения анатомии и восприятия человека. Кроме того, на многих исходниках кисти рук показаны с разных ракурсов, так что видно разное количество пальцев — а когда предметов много, но неясного количества, машина выдаёт случайный результат.

Плохо нарисованным рукам посвящено множество мемов в интернете. Пользователи создают целые профили и сообщества, в которых публикуют странное творчество ИИ.

Хотя за последнее время нейросети натренировались рисовать достаточное количество пальцев, результат всё равно далёк от реальности: руки часто выходят непропорционально маленькими или большими, пальцы — длинными, а суставы изогнуты неестественным образом.

Лишние зубы, языки и челюсти

Порой нейросеть рисует зубы и другие детали рта не лучше рук: рот во рту, челюсть на челюсти, кривые зубы или безумное их количество. Как и в случае с конечностями, ИИ понятия не имеет, как изобразить много похожих объектов в рамках одного, и почему конечный результат не выглядит натурально.

Часто нейросеть нарисует зубы нереалистичными или неправильно торчащими, но широкая улыбка или открытый рот — это большой риск испортить в целом интересный арт одной деталью.

«Что-то с глазами»

Эту проблему продемонстрировали многочисленные эксперименты с нейросетью Lensa, в которой пользователи делали для себя аватарки в различных стилях по фото. Многие жаловались на косые глаза и странный взгляд на изображениях. Причём отбраковывать такие картинки было особенно обидно — в остальном многие из них выходили красивыми и яркими.

Как отмечает Medialeaks, наибольший процент «глазного» брака встречается на изображениях человека в очках. На остальных портретах они показаны более корректно.

Однако даже на артах от более продвинутых нейросетей глаза могут быть нарисованы нормально и направлены на зрителя, но как будто в расфокусе. Взгляд «стеклянный», неживой. Вот такие арты опубликовали пользователи Midjourney в открытом чате в Discord.

Проблема сохраняется и тогда, когда ИИ призван решить проблему зрительного контакта человека с камерой. Недавно компания Nvidia выпустила технологию на основе нейросети, которая позволяет создать имитацию зрительного контакта на видео, если человек не смотрит в камеру. Выглядит это так, как будто ИИ просто поменял расположение глаз — взгляд такой же неживой и расфокусированный, как на многих картинках от нейросетей.

Также «дипфейковые» глаза движутся неестественно быстро — это отметил журналист The Verge, протестировавший новую функцию. На части видео он смотрит в камеру, так что зритель может увидеть разницу между тем, как это выглядит до и после обработки ИИ. Наличие и отсутствие очков никак не сказалось на качестве изображения.

Обрезанные головы и перекошенные лица

Бывает и такое, что нейросеть генерирует арт с человеком с урезанной головой или вовсе без неё. Дело в том, что при загрузке референсов люди добавляют картинки не во весь рост или такие, где туловище занимает большую часть пространства — нейросеть путается и начинает считать именно торс самой важной частью потрета, позволяя себе обрезать голову.

Однако хуже обрезанной головы может быть только плохо нарисованная голова с перекошенным лицом. Это не редкость в работах ИИ. Нейросеть может неестественно расположить части лица и слить его с пространством. Понятия «естественно» у технологии нет, а так как все люди разные, при поиске универсальных решений ошибки неизбежны.

Размытые детали, пятна и линии

Бывает такое: арт от нейросети кажется красивым и детализированным, но если начать присматриваться, то оказывается, что никакие конкретные детали там не прорисованы. Эта проблема встречается чаще, чем может показаться: вместо цветов — пятна, вместо птиц — пятна, вместо надписей — линии и пятна. Формы напоминают то, что должно быть изображено, но ничего в сущности разглядеть на таких картинках нельзя.

Как избежать распространённых ошибок

Обычным пользователям, которые генерируют контент в нейросетях, любители технологии рекомендуют избегать рисовки рук (такой параметр можно выбрать в интерфейсе отдельных ИИ, включая Midjourney) или изображать их так, чтобы они были заняты. Также повысит шансы на успех детализация кистей рук: лучше подробнее описать, как выглядят пальцы и кожа на них.

Чтобы нейросеть не обрезала голову персонажам, можно загружать референсы в полный рост. Запрос к ИИ на изображение человека в полный рост также помогает избежать проблемы обрезки. Кроме того, результат может улучшить детализация — стоит описать, что делает персонаж, его движения и положения конечностей. Но при этом не стоит запрашивать потреты и добавлять положительную оценку: дело в том, что ИИ считает изображения людей с обрезанной головой более привлекательными.

Технология ещё учится, и многие работы уже сейчас корректнее изображают человека и реальные предметы. Есть ли в будущем место человеческим дизайнерам — это открытый вопрос, на который можно будет ответить только спустя годы, наблюдая за развитием искусственного интеллекта.

Новости по теме
Обсудить с другими читателями:
Ваш браузер устарел
На сайте Sostav.ru используются технологии, которые не доступны в вашем браузере, в связи с чем страница может отображаться некорректно.
Чтобы страница отображалась корректно, обновите ваш браузер.
Ваш браузер использует блокировщик рекламы.
Он мешает корректной работе сайта. Добавьте сайт www.sostav.ru в белый список.