Нейросети Midjourney и DALL-E испытывают трудности с генерацией картинки чистого белого фона. К такому выводу пришёл независимый исследователь по обработке данных Коди Нэш и редакция Bleeping Computer.
Нэш попытался сгенерировать в DALL-E изображение простого, чистого белого фона (цвет #FFFFFF или RGB(255,255,255)) без каких-либо объектов или деталей. Эта предельно простая, казалось бы, задача обернулась серьёзной проблемой для ИИ. Несколько первых промтов выдавали неподходящий результат:
«Картинка, где нет ничего, кроме белого цвета» (An image that is nothing but the color white);
«Картинка, где ничего, кроме белого, белого, белого, белого» (An image of nothing but white white white white);
«Абсолютно белый без каких-либо доабвлений» (Completely white without any additional features);
«Пустое белое пространство» (A blank white space);
«Изображение из чистых пикселей #FFFFFF» (An image of pure #FFFFFF pixels);
«Белая стена» (A white wall).
Наконец несколько промтов спустя на просьбу о «гладком, ровном, полностью белом фоне» DALL-E представила Нэшу, вероятно, самое близкое изображение к требуемому:
DALL-E сгенерировала серый квадрат
Редакция BleepingComputer повторила этот эксперимент с Midjourney и DALL-E. Их промты также не смогли заставить нейросеть выдать то, что нужно.
В итоге DALL-E зависла, когда у неё попросили сгенерировать «просто белый фон». А Midjourney продемонстрировала собственное понимание «гладкого, ровного, полностью белого фона».
Похожие трудности у нейросетей вызывают и просьбы сгенерировать просто чёрный цвет.
Midjourney: «полностью чёрный фон»
Редакторы Bleeping Computer распространили эксперимент и на ChatGPT, только в этом случае нейросеть попросили не генерировать минималистичные изображения, а просто ничего не делать. Результат показал, что это невозможно: даже когда нейросеть понимает запрос, она не может помолчать.
Источник: habr.com