Ни для кого не секрет, что генеративные модели искусственного интеллекта весьма посредственно справляются с созданием текстового контента, особенно на русском языке. Всё дело в том, что LLM обычно обучаются на открытых датасетах, в которых русский язык не представлен вовсе или представлен на очень низком уровне. Соответственно, представители компании Яндекс решили эту проблему свести на нет — теперь ИИ-ассистент Алиса AI использует для создания изображений обновлённую большую языковую модель Alice AI ART, которую компания обучила на собственном масштабном датасете. В результате пользователи получили возможность создавать постеры, афиши, открытки и многое другое с надписями на русском языке практически без ошибок.
Представители компании рассказали, что для обучения своей модели в стенах Яндекса был создан датасет изображений с надписями на русском языке и детальной разметкой текста. Более того, компания изменила архитектуру своей модели, что в итоге позволило российской нейросети в три раза чаще генерировать изображения без ошибок или нечитаемых букв. «Для этого достаточно использовать простые приёмы: заключать текст в кавычки, писать сложные слова заглавными буквами, разбивать длинные надписи на более короткие фразы», — объяснили представители компании Яндекс.
Но это ещё не всё — также разработчикам удалось повысить качество генерации изображений примерно на треть. Теперь ИИ выдаёт меньше картинок с визуальными искажениями, плюс нейросеть гораздо лучше понимает русский культурный код. Для этого, если верить пресс-релизу компании, нейросеть обучали на русскоязычных промптах. «Например, если написать в чате с Алисой AI „Изобрази русский народный ансамбль”, нейросеть создаст изображение с гармонистами и балалаечниками, а по запросу „Традиционный русский праздничный стол” — картинку с икрой, соленьями и самоваром. Если попросить Алису AI создать иллюстрацию на космическую тему, модель добавит на картинку российских космонавтов», — сообщили представители Яндекса.
Примечательно, что ИИ после апдейта заинтересует в том числе бизнес — можно создавать изображения для карточек товаров, лендинги, брошюры и так далее.
Источник: trashbox.ru