Midjourney vs DALL-E 2.
Какая нейросеть лучше?

Недавно мы рассказывали о новейших нейросетях и их возможностях, если Вы пропустили или еще не успели прочитать, ознакомиться можно здесь.

В этой статье мы продемонстрируем, как нейросети обрабатывают запрос и сравним, какая из них генерирует более качественные, интересные и подходящие изображения.

Итак, для генерации картинок были выбраны нейросети Midjourney и DALL-E 2.

Мы задействовали шесть тем, по три картинки в каждой. При этом для первой картинки стиль, техника и размер не были заданы, в отличие от второй и третьей.

Вот, что из этого вышло:

Дом дракона

Текст запроса: house of the dragon, fantasy, epic, extremely detailed, ultra-realistic.
Дополнительно ко второй картинке: ink drawing, calligraphy. Размер 4:3 (только для midjourney).
Для третьей картинки: cartoon, ghibli style. Размер 2:3 (только для midjourney).

MidJourney

DALL-E 2 

В первом изображении обе нейросети справились с задачей, стиль был передан корректно. У Midjourney получились интересные варианты, с хорошей детализацией, а DALL-E 2 несколько уступает в атмосфере и чистоте линий.

Архитектор матрицы

Текст запроса: the matrix is a character standing with his back in the technological world, epic, cyberpunk, extremely detailed, ultra-realistic.
Вторая картинка: color pencil drawing. Размер 16:9 (только для midjourney).
Третья картинка: drawing with oil paints. Размер 9:16 (только для midjourney).

MidJourney

DALL-E 2 

Во втором примере DALL-E 2 уже сильно проигрывает другой нейросети. Мы видим достаточно скромный минималистичный фон в первых двух генерациях и однотипность картинок, хотя в ключевых словах было указано extremely detailed, тогда как в Midjourney все три изображения выглядят по-разному.

Облачный сервер

Текст запроса: servers in the form of clouds, epic, cyberpunk, extremely detailed, ultra-realistic.
Вторая картинка: pencil drawing. Размер 1:2 (только для midjourney).
Третья картинка: watercolor painting. Размер 2:1 (только для midjourney).

MidJourney

DALL-E 2 

У Midjourney лучше детализация, облака выглядят более воздушно. Картинки DALL–E 2 же стилистически схожи между собой, ощущается, будто все нарисовано красками.

Разноцветный огонь

Текст запроса: man warms himself by a rainbow fire in a black and white world, epic, cyberpunk, extremely detailed, ultra-realistic.
Вторая картинка: 3D, 3D render, redshift. Ширина 1280px (только для midjourney).
Третья картинка: comic drawing. Размер 1:1 (только для midjourney).

MidJourney

DALL-E 2 

В четвертом примере прослеживаются техники и стилистика исполнения. У DALL-E 2 меньше читается соотношение цветного и черно-белого, тогда как у Midjourney плавный цветовой переход и более гармоничная сюжетность.

Шахматные фигуры

Текст запроса: сhess pieces instead of skyscrapers in autumn, epic, cyberpunk, extremely detailed, ultra-realistic.
Вторая картинка: gothic style. Размер 7:4 (только для midjourney).
Третья картинка: surrealism style. Высота 2048px (только для midjourney).

MidJourney

DALL-E 2 

В пятой теме обе нейросети показали себя отлично по атмосфере. Но DALL-E 2 не сделал шахматные фигуры вместо высоток, хотя у Midjourney наглядно видно соразмерность их с высотками. Это была единственная тема, где мы прописали конкретное время года и заметим, что на всех артах преобладают осенние деревья.

Ключ к успеху

Текст запроса: the key to success is the object, the key, the object, purple and turquoise color, epic, cyberpunk, extremely detailed, ultra-realistic.
Вторая картинка: modern style.
Третья картинка: minimalism style.

MidJourney

DALL-E 2 

Шестую тему DALL-E 2 принял слишком буквально и отразил обычный ключ, Midjourney же дал волю структуре и выдал интересные варианты. Мы прописали, в каких цветах желаем видеть картинку (т.е. фиолетовый и бирюзовый) — как мы видим, с этим они справились.

Какие выводы можно сделать:

  • Удобно, что в Midjourney можно задавать свой размер или соотношение сторон. (т.к. DALL-E 2 по канону только 1024 на 1024)
  • Нейросети вполне корректно отражают время года, указанную цветовую палитру, технику или стиль рисунка.
  • Midjourney чуть поинтереснее справляется с абстрактными вещами, как «ключ к успеху», что касается материальных объектов, обе нейросети отражают близко к тому, что ожидаешь увидеть.
  • Midjourney все же выдает более атмосферные и качественные арты. Возможно, это связано с тем, что у них открытое бэта тестирование, в отличие от DALL-E 2. Тем самым, нейросеть быстрее учится понимать запрос, наблюдая, что чаще выбирают люди для дальнейшего развития.

Надеемся, наше небольшое исследование было Вам интересно и помогло ответить на несколько актуальных вопросов: «что лучше dall-e 2 или midjourney?», «чем отличается stable diffusion от midjourney?», «чем заменить midjourney?», «можно ли использовать изображения из midjourney?».

Разумеется, главный вопрос – «какую нейросеть выбрать?» остается полностью в Вашем распоряжении, а мы желаем успехов Вашим увлекательным и амбициозным проектам, которые могут быть реализованы с помощью искусственного интеллекта.