Разработчик Дилан Руссель поделился в Х, что Google планирует добавить в чат-бота Bard функцию генерации изображений. Он поделился скриншотом журнала изменений, датированного 18 января.
По словам Русселя, Bard будет использовать Imagen, модель преобразования текста в изображение от Google.
Компания представила собственную нейросеть для генерации изображений по описанию в 2022 году. Тогда разработчик заявил, что Imagen справляется с понимаем сложных запросов лучше, чем DALL-E 2.
Осенью 2023 года Google начала тестировать в поисковике функцию SGE (Search Generative Experience) на основе Imagen.
В конце 2023 года Google представила модель Imagen 2, которая генерировать более реалистичные изображения, используя естественное распределение обучающих данных вместо заранее запрограммированного стиля. Она отличается улучшенным пониманием контекста, обеспечивает рендеринг реалистичных рук и человеческих лиц, а также может расширять исходную картинку.
Технология тогда стала доступна разработчикам и клиентам Cloud через Imagen API в Google Cloud Vertex AI.
Imagen 2 интегрировали с SynthID, набором инструментов для нанесения водяных знаков и идентификации контента.
Источник: habr.com