Нейросети в искусстве:
новейшие системы и их возможности

В последнее время прослеживается тенденция на работу с искусственным интеллектом у художников и дизайнеров. Появляются новые платформы, которые переосмысливают знакомые нам ранее представления о дизайне и визуализации.

В 2021 году американской компанией OpenAI, которая разрабатывает и лицензирует технологии на основе машинного обучения, была представлена нейросеть DALL-E. Она может создавать изображение по его текстовому описанию. Связь между смысловым значением текста и визуальным представлением обеспечивает модель CLIP. Она изучает насколько картинка релевантна к фрагменту текста, обучаясь на сотнях миллионов изображений и связанных с ними подписей.

DALL-E 2 

Разработчик: OpenAI
Официальный сайт: https://openai.com
Статус: preview beta

Dalle art - Leonardo enters the metaverse

Разработка была признана успешной и в 2022 году компания анонсировала DALL-E 2, которая для создания изображения использует модель диффузии, редактируя изображения, но сохраняя стиль и экспозицию (ранее подобный подход был реализован в системе GLIDE). Она создает более реалистичные и точные изображения до 1024 на 1024px. На официальном сайте представлены вариации, как нейросеть дорисовала известные классические картины, а недавно сгенерированные изображения от DALL-E 2 по запросу «Последнее селфи на Земле» наделали немало шума в интернете.

В настоящее время проект находится в стадии «preview» и компания ограничивает доступ к новейшему ИИ, что связано с соблюдением политики и условий в отношении сгенерированного контента. Но любой желающий может добавиться в waitlist для получения доступа, когда это станет возможным.

Midjourney

Разработчик: MidJourney (независимая группа разработчиков)
Официальный сайт: https://www.midjourney.com/
Статус: open beta

Одна из самых популярных и модных нейросетей в 2022 году, создающая яркие и реалистичные изображения, работающая по приглашению через Discord.

Midjourney использует модель Clip, где постоянно меняются методы генерации изображений. Максимальный размер 1664 на 1664px (можно выбрать формат изображения до 3 млн. px). Бесплатно доступно 25 условных gpu-минут работы нейросети в месяц – это плюс-минус 25 артов, платные подписки временно недоступны для РФ.

Midjourney artMidjourney art

Попробовать уже сейчас

А вот примеры для тех, кто уже сейчас хочет испытать всю мощь ИИ и поэкспериментировать с изображением на основе нейросети:

Wombo Dream

Wombo DreamWombo DreamWombo Dream

Разработка канадской компании Wombo, где можно придумать описание и выбрать художественный стиль, либо загрузить свою картинку, а далее ИИ предоставит вам свои варианты.

Мобильное приложение Dream вышло на iOS и Android в конце 2021 года, уже успело завоевать сердца пользователей и получить от них высокую оценку.

RuDall-E

Нейронная сеть, выпущенная командой SberDevices и Sber AI при содействии SberCloud, генерирует изображения на основе текстового описания на русском языке.

Работает через бот в Discord, также было выпущено приложение «Салют», где можно создать картинку даже по голосовому запросу.

Rudalle artRudalle artRudalle artRudalle art
Тем самым это развивающееся направление искусственного интеллекта может стать вдохновением для художников, а также ускорить создание контента. Однако, по мнению многих пользователей интернета, в скором времени нейросети смогут конкурировать с людьми творческих профессий, не уступая в креативности и реалистичности артов.

Нейросети в изобразительном искусстве, разумеется, только набирают обороты и ставят перед нами множество вопросов: «какую нейросеть выбрать?», «должен ли ai-artist быть айтишником», «как нейросети научились творить», и самое острое – «убьют ли нейросети коммерческое искусство?»

Пока не доказана та или иная точка зрения, каждый вправе оставаться при своем мнении. Но уже сейчас глупо спорить с тем, что нейросети в искусстве добились определенных впечатляющих результатов. Ai-art пошатнул элитарность искусства, сделав его более доступным.

И пусть сама фраза «искусственный интеллект проявил себя в искусстве» звучит как повторяющийся набор слов, это работа с большими данными, которая ведется непрерывно, требует огромных мощностей и усилий и не оставляет равнодушными ни своих приверженцев, ни противников. Love it or hate it – третьего не дано.