Все вокруг говорят о магическом ИИ MidJourney, который способен сделать шедевры из текстовых запросов пользователей веба.

Примеры картин, нарисованных пользователями нейронной сети:

Изображение

Изображение
Изображение

Изображение
Изображение
Изображение


Midjourney (в народе «пол пути») — это ИИ, преобразующее текст в изображения. Сейчас запущен бета-тест при помощи бота Discord. с помощью ему можно сделать что вашему и его воображению угодно.

Всего для нового пользователя Discord безвозмездно доступно 25 GPU-минут либо как я называю круток, которые тратятся на приблизительно 25 действий (также другие варианты, улучшение разрешения и фактически создание новой серии картинок).

Команда Midjourney разъясняет это тем, что их детище популярно и эта известность выходит боком для интернетсерверного оборудования.

Создаем свою картину

Для использования необходима регистрация на интернет-ресурсе Discord.

Если не зарегистрированы, то это можно сделать по ссылке.

Дальше мы заходим на сервер Midjourney, принимаем приглашение:

Заходим в любой канал “newbies” и набираем первую команду – /info,

видим сколько  у нас доступно GPU (валюты для генерации картинок):

Начинаем творить, вводим команду /imagine <ключевые слова>

где <ключевые слова> – любые слова на английском, разделенные пробелом (можно и на русском, но качество будет хуже)

Например, я ввел:

/imagine apocalyptic moscow after war girl with baloon

Вот что нарисовала нейронка:

Изображение

 

Снизу под картинкой доступны доп команды:

Меню после генерации:
  • U — апскейлинг или увеличение разрешения. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
  • Кнопка на уровне с апскейлингом генерация новых изображений по тому же запросу.
  • V — вариации или сделать ещё 4 похожие. 1 — верхнее лево, 2 — верхнее право, 3 — нижнее лево, 4 — нижнее право.
Мне понравилась картинка слева внизу, поэтому сделаю ее апскейлинг, жму кнопку U3:
Получили финальную картинку в хорошем качестве:
Изображение
Меню после апскейлинга:
  • Make Variations создает новые 4 изображения похожие на апскейлнутое
  • Upscale to Max и Light Upscale Redo — вариации апскейла. Исходя из названия один сильный, другой послабее.
  • Web открывает ссылку на изображение на сайте-галерее
  • Эмодзи позволяют оценить работу, свою или чужую. Ведь никто не оценит лучше чем ты сам.

Выбираю “Upscale to Max”, чтобы получить шедевр максимального качества:

Кликаю по ссылке “Web” чтобы получить доступ к картинке с макс качеством:

https://www.midjourney.com/app/jobs/a932359a-8d31-41c0-b9fc-87e81c19e786/

Все, шедевр готов , можно скачивать и нести в типографию на печать и рамочку под картину искать.

Опции генерации картинок

Можно задавать доп. параметры, чтобы объяснить “нейронке”, какую картину ты хочешь получить в итоге.

Их список ниже…

Для разграничения запроса употребляются ” :: ” (с пробелами), другими словами приемлим «girls on beach :: steven universe style, hd, octane render –ar 16:9 –no rocks».

Поначалу текстовой запрос, позже технические характеристикик примеру соотношение сторон и то, что должно отсутствовать. Стиль можно в обоих вариантах, я предпочитаю после разделения. Можно и через “,”, как делают все новенькие, но мы профи, потому через ” :: ”

Далее мы сосредоточимся на параметрах после “::”. Сюда врубаются в главном технические характеристики.

  • Вес (::x, где x количество). Кроме того употребляются для регулирования соотношения каких-то частей на изображении, но применять их необходимо без пробелов, другими словами “car::80, road::20”. Малое количество – -10000, наибольшее – 10000.
  • Стилизация (–s x, где x количество). Один из характеристик, который в настройках можно поставить по дефлоту на каком-то значении. Не путать со стилями художника, кинофильма и телесериала, это другое. Чем больше количество, тем абстрактнее и походит на прекрасный пейзаж. Советую ставить в настройках (/settings) или по дефлоту (2000) либо немногим выше (5000) значение. Малое количество – 625, наибольшее – 60000.
  • Качество (–q x, где x количество). 2-ой из характеристик, который в настройках можно поставить по дефлоту на каком-то значении. Чем больше, тем больше деталей и привлекательнее в общем, но также больше тратится GPU-минут и времени на создание. По дефлоту – 1, малое количество – 0.25, наибольшее – 2 (некогда было 5).
  • Высочайшее разрешение (–hd ). Потенциально лучше для огромных изображений, т.к. употребляет другую композицию, но меньше деталей. Притом разрешение сгенерированных изображений будет больше. Хороший вариант не растрачивая действие на апскейлинг получить картину побольше. По тестам, просто делает уже апскейлнутую серию из 4 картинок.
  • Соотношение сторон можно задать 2-мя способами1-ый через (–ar x:y, где x ширина, y высота). К несчастью при мощной разнице высоты и ширины соотношение “сглаживается”, лучше применять 2-ой вариант.
    • Кроме того соотношение сторон можно задать (–w x, где x ширина) и/либо (–h y, где y это высота). Лучше сработает, если количество кратно 64 (либо 128 в случае с –hd).Пример: Landscape, Clouds, River, Mountain, Ocean :: Wakfu style –h 2560 –w 256
  • Без (–no x, где x слово). Если ИИ в один момент добавляет на изображение какой-то элемент, то его можно убрать при помощи этого параметра. Я уже добавлял изображение с таким параметром, оно располагается после разъяснения про ” :: “, а вот так смотрелось бы изображение без “без”. Это случается т.к. стиль Steven Universe связан с камнями, потому на пляже их большое число.
  • Сид (–seed x, где x цифра). Каждому изображению присваивается своё семя, потому изображение можно повторить, несмотря на то, что только в исходных шагах генерации. Чтоб выяснить его необходимо будет поставить эмодзи письма либо :envelope: на сгенерированное изображение
    • К примеру у всех этих изображений один сид, только у 2 рисунки этот же запрос что у 1, а 3 картина с запросом “пустыня”.
  • Референс-изображение (через ссылку на изображение). Изображения берутся как стили, но не как содержание, потому так вы не можете обойти запрещенные слова. Можно добавить несколько иллюстраций, но отрегулировать вес каждого нельзя.
  • Регуляция веса (–iw x, где х это количестводозволяет усилить воздействие на конечное изображение референса. По-умолчанию 0.25, очень – 5.
  • Видео (–video). Для вас будет выслан процесс генерации в виде видео через сообщение лс, но необходимо будет поставить эмодзи письма либо :envelope: на сгенерированное изображение. Детальнее об эмодзи ни

Подробнее см. в гайдах ниже. Не теряйте время, пробуйте уже создать свою картину!

PS: остается вспомнить о том, что полученные цифровые картины можно попробовать продавать на рынке как NFT, о том как это сделать – см. в моем поcте про NFT.

PPS: мой прочие эксперименты с нейронкой, на которые я потратил оставшиеся 20 баллов gpu:

  • Программист и кошка
/imagine programmer sitting with cat and boil of cup at night in front of the monitor at night
Изображение

ну вышла только кошка….

  • Суперкомпьютеры
/imagine artificial intelligence supercomputer
Изображение

красиво )

  • Рисуем медвежуть
/imagine teddy bear sitting on chair on dark room full of spiders
Изображение

Этот медведь понравился больше всего, на меня похож ) :
Изображение

  • Рисуем розу на закате
/imagine rose in vase on table before the sea on sunset 
Изображение

Понравилась первая роза, апскейлим ее:
Изображение

  • Попробуем что-то на русском: вспомним классика, Михалкова:
/imagine мохнатый шмель на душистый хмель цапля серая в камышах

Изображение

да, тут нейронка явно растерялась что рисовать

  • Ну давайте что попроще попробуем:
/imagine русская деревня куры козы избы солнце светит

Изображение

в общем, можно сделать вывод что русский язык нейронка не понимает (ну или с трудом)

Я предположил, что у нейронки классно получается рисовать депрессивный и апокалиптические картины.

Давайте проверим это:

/imagine end of the world fire smoke terminator
Изображение

Да, впечатляет, согласитесь? №1 увеличим?
Изображение

Жутко красиво!

  • Теперь нарисуем что-то райское:
/imagine heaven flowers birds deers mountains --q 2

(*) здесь –q 2 означает макс. детализацию (по умолчанию – 1)

Изображение

Понравилась 4я , но посмотрим ее вариации, нажав команду V4:

Изображение

Ооо, красота, апскейлим последнюю, 4ю: команда U4 :

Изображение

  • Что-то я проголодался… нарисую себе еду:
/imagine table with food fruits meat vegetables grape wine cakes

Изображение

  • А можно с курьером с доставкой на дом?
/imagine courier on bicycle brings pizza with beer to my house

Изображение

  • Что то еще на тему голода, чтоб за душо брало:
/imagine hunger afro-american girl crying

Изображение

ну идею голода передать не удалось, но лицо выразительное, ага?

Изображение

Красиво, эстетично ….

  • Сделаем картину на профессиональную тему ….
/imagine hr specialist mak calls by phone sitting on chair with notebook
Изображение

Ну и еще на проф. тему, арт состряпаем:

/imagine web developer programmer on notebook
Изображение
ну такое себе ... ноутбук это записная книжка по ихнем, эх
  • А давайте что-то на тему семьи:
/imagine happy family four girls mother father in the middle --q 2
Изображение
  • Ну давайте еще раз попробуем …
/imagine mother father four childs girls

Изображение

  • А давайте посмотрим с чем нейронка ассоциирует Россию:
/imagine russia

Изображение

ну как бэ да, но…. стоило бы уточнить запрос

  • Ну пусть будет медведь
/imagine russia bear

Изображение

  • Ну что ж, закончились баллы, финальное:
/imagine bue

Изображение

Всем спасибо, все свободны )


Доп. материалы

Видео гайд по работе с нейронкой:

Руководства по работе с нейросетью:

Tags

Нет Ответов

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Рубрики


Подпишись на новости
👋

Есть вопросы?