Что такое Midjourney AI и как он работает?

Что, если бы вы могли вызвать образ прямо из своего воображения? Теперь вы можете это сделать за считанные минуты благодаря генераторам изображений с искусственным интеллектом, таким как Midjourney. Неважно, не хватает ли вам художественных навыков или вы даже в жизни не держали в руках кисть. Искусственный интеллект может создать цифровое искусство за считанные секунды — все, что вам нужно сделать, это указать несколько слов, описывающих изображение, которое вы задумали. Но как на самом деле работает Midjourney? Вот все, что вам нужно знать.

Что такое Midjourney?

Midjourney — это пример генеративного искусственного интеллекта , который может преобразовывать подсказки на естественном языке в изображения. Это лишь один из многих генераторов изображений на основе машинного обучения, появившихся в последнее время. Несмотря на это, он стал одним из крупнейших имен в области искусственного интеллекта наряду с DALL-E и Stable Diffusion .

С помощью Midjourney вы можете создавать высококачественные изображения из простых текстовых подсказок. Для использования Midjourney вам не понадобится какое-либо специальное оборудование или программное обеспечение, поскольку оно полностью работает через приложение чата Discord. Единственный недостаток? Вам придется заплатить хотя бы немного, прежде чем вы сможете начать создавать изображения. В отличие от большинства конкурентов, которые обычно предоставляют как минимум несколько поколений изображений бесплатно.

Тем не менее, порог входа в Midjourney довольно низок, и каждый может использовать его для создания реалистичных изображений за считанные минуты. Результаты могут варьироваться от сверхъестественных до визуально ошеломляющих, в зависимости от подсказки.

Midjourney может создавать потрясающие и убедительные изображения из простого текстового описания.

В некоторых случаях изображения Midjourney даже обманули экспертов в области фотографии и других областей. Точно так же вы, возможно, видели в социальных сетях некоторые чрезвычайно убедительные изображения, созданные ИИ. Примеры варьируются от Папы Франциска, одетого в пуховик, до Трампа, предположительно арестованного за несколько дней до фактического события. Но мы также видели некоторые творческие поколения, например, сцену из «Звездных войн» в стиле Уэса Андерсона (на фото выше).

В отличие от DALL-E, который поддерживается создателем ChatGPT OpenAI, Midjourney позиционирует себя как самофинансируемый и независимый проект. Более того, на сегодняшний день он не получил никакого внешнего финансирования. С другой стороны, OpenAI привлекла около 10 миллиардов долларов от Microsoft и нескольких других инвесторов. Так что, учитывая скромные корни Midjourney, ее результаты весьма впечатляют.

Как работает Midjourney?

Midjourney работает на закрытом и проприетарном коде, поэтому никто за пределами компании не знает, как он творит чудеса. Тем не менее, мы знаем достаточно о базовой технологии, чтобы предложить общее объяснение.

Midjourney опирается на две относительно новые технологии машинного обучения , а именно модели большого языка и модели диффузии. Возможно, вы уже знакомы с первым, если использовали чат-ботов с генеративным искусственным интеллектом, таких как ChatGPT . Большая языковая модель сначала помогает Midjourney понять значение слов, которые вы вводите в подсказки. Затем он преобразуется в так называемый вектор, который вы можете представить как числовую версию вашего приглашения. Наконец, этот вектор помогает управлять другим сложным процессом, известным как диффузия.

Midjourney использует модель диффузии, чтобы превратить случайный шум в красивое искусство.

Распространение стало популярным только в последнее десятилетие или около того, что объясняет внезапный поток произведений искусства, созданных искусственным интеллектом . В диффузионной модели компьютер постепенно добавляет случайный шум в набор обучающих данных изображений. Со временем он научится восстанавливать исходное изображение, обращая шум. Идея состоит в том, что при достаточном обучении такая модель может научиться генерировать совершенно новые изображения.

Так как же это выглядит с точки зрения генератора изображений ИИ? Когда вы вводите текстовую подсказку типа «белые кошки на постапокалиптической Таймс-сквер», она начинается с поля визуального шума. Вы можете думать об этом первом шаге как об эквиваленте помех на телевидении. На данный момент изображение не похоже ни на что, о чем вы просили. Однако обученная модель ИИ затем использует скрытую диффузию для поэтапного вычитания шума. В конечном итоге получится картина, напоминающая объекты и идеи реального мира.

Кстати, именно поэтому вам обычно нужно подождать минуту или две, чтобы изображение, сгенерированное ИИ, полностью проявилось. Если вы остановите процесс раньше, вы получите зашумленное изображение, которое не прошло достаточного количества шагов по шумоподавлению.

Сколько стоит Midjourney?

Хотя мы видели, что чат-боты, такие как ChatGPT и Microsoft Copilot,  предлагают почти неограниченное количество бесплатных текстовых ответов, этого нельзя сказать о генераторах изображений. Практически у всех из них есть некоторые ограничения, а Midjourney даже не предлагает бесплатную пробную версию. Это связано с тем, что каждая задача создания изображения требует большой вычислительной мощности, особенно графических процессоров (GPU). Более того, каждый графический процессор имеет ограниченный объем видеопамяти, которая в больших объемах используется для процесса шумоподавления.

Учитывая это, неудивительно, что современный генератор изображений с искусственным интеллектом будет стоить вам денег. У нас есть специальное руководство по ценам и уровням подписки Midjourney , но вам придется платить минимум 10 долларов в месяц. Это дает вам 3,3 часа использования графического процессора, что достаточно для примерно 200 поколений изображений. Между тем, самый дорогой план дает вам 60 часов быстрого использования графического процессора за 120 долларов в месяц.

Комментарии: 0