ClarifyPix
Назад в блог

Как увеличить изображения Midjourney до 4K без потери деталей

Встроенный увеличитель Midjourney сглаживает точные текстуры, которые делают ваши генерации реалистичными. Вот рабочий процесс, который действительно сохраняет эти детали в 4K.

ClarifyPix Team2026-03-18

В прошлом году я испортил заявку в галерею. Не потому, что искусство было плохим. Я потратил три дня на создание и обработку результатов Midjourney для местное групповое шоу. Композиции были именно такими, как я хотел. Тогда я масштабировал их все с помощью встроенного средства масштабирования Midjourney и отправлял их на принтер.

Когда тестовые отпечатки вернулись, я их почти не узнал. Каждый кусочек текстуры ткани исчез. Атмосферная дымка, которую я любил были сжаты в плоские плавные градиенты. Кожа на каждом портрет выглядел так, будто бьюти-фильтр мобильного телефона был включен на полную мощность максимум. Мне пришлось отказаться от участия в шоу.

Именно тогда я понял, что Midjourney имеет встроенный апскейлер и Правильный внешний апскейлер делает совершенно разные вещи. Если ты делаем изображения для Instagram, встроенные инструменты подходят. Если ты хотите распечатать, продать распечатки или продемонстрировать свою работу в полном разрешении, вам нужен другой подход.

Что на самом деле делает апскейлер Midjourney

Midjourney предлагает несколько режимов масштабирования. Тонкий, Креативный и старые варианты V5. Все они работают по одному и тому же принципу. Модель смотрит на ваш имидж и пытается улучшить его целостно. Оно обостряет, сглаживает и корректирует общую композицию.

Проблема в том, что “целостный” означает, что он не может сказать разница между тем, что вы хотите сгладить, и тем, что вы хотите сохранить острый. Шумный фон следует сгладить. Схема переплетения на льняной рубашки быть не должно. Midjourney относится к ним одинаково.

Больше всего я заметил это на изображениях со сложными материалами. Кожа вышла выглядит как коричневый пластик. Текстуры шерсти исчезли полностью. Все, что рассеивается под поверхностью, например, кожа или свечной воск, попадает слились в одну однородную поверхность.

Специальный внешний апскейлер исправляет это.

Внешние специалисты по масштабированию, такие как Real-ESRGAN, обучаются по-другому. Вместо стремясь улучшить весь имидж сразу, они обучались на миллионах пар фотографий, чтобы освоить определенный навык. Учитывая изображение с низким разрешением, как должна выглядеть версия в высоком разрешении? Они учатся предсказать, где должны находиться детали, и сгенерировать их пиксель за пикселем.

Разница наиболее заметна по текстуре. Вот что я увидел, когда протестировал один и тот же результат Midjourney 1024x1024 обоими методами.

Апскейлер Midjourney на портрете старика в шерстяном пальто. На первый взгляд лицо выглядело хорошо, но увеличьте масштаб. Поры и тонкие линии которые заставляли его выглядеть настоящим, исчезли. Шерстяное пальто превратилось в коричневую каплю. без видимого переплетения. Это было похоже на очень хороший рендер из видеоигры. 2016 года, а не произведение искусства для печати.

То же изображение через Real-ESRGAN с увеличением 4x. Поры были. Ты мог бы см. отдельные волокна шерсти. Швы на воротнике пальто были острыми. достаточно, чтобы посчитать нити. Оно по-прежнему выглядело как тот же мужчина и такое же пальто. Просто яснее. Более реальный. При разрешении 4096x4096 он был готов к 13-дюймовая печать с разрешением 300 DPI.

Рабочий процесс, который я использую сейчас

Я делаю это просто, потому что я узнал, что добавление шагов обычно приводит к дела обстоят хуже, а не лучше. Вот что я делаю для каждого произведения, которое планирую распечатайте или продайте.

Сначала я загружаю выходные данные Midjourney в самом высоком разрешении. доступен. Обычно это 1024x1024 или 1664x1088 в зависимости от соотношение сторон. Всегда скачивайте в формате PNG. Сжатие JPEG добавляет артефакты на этом этапе они усиливаются при повышении масштаба.

Во-вторых, я загружаю на внешний апскейлер и запускаю 4-кратное увеличение. Это на одно изображение уходит от пяти до восьми секунд. Стоимость большинства составляет 4 кредита. платформы, использующие Real-ESRGAN. В результате получается изображение размером 4096x4096, которое печатает на расстоянии 13,6 дюйма при разрешении 300 точек на дюйм. Достаточно хорошо для большинства галерейных выставок и художественные принты.

В-третьих, я проверяю лица. Если бы в поколении Мидджорни были люди При этом шаг масштабирования иногда слегка смягчает детали лица. В в этом случае я запускаю отдельный этап восстановления лица с использованием GFPGAN. Это стоит еще 4 кредита. Если на изображении нет лиц или лица были уже острый, я пропускаю это полностью.

Вот и весь рабочий процесс. Экспорт PNG, масштабирование 4x, исправление при необходимости лица. Два шага для большинства изображений и три, если есть люди. Общая стоимость составляет 4 или 8 баллов в зависимости от того, задействованы ли лица. Общее время обработка занимает менее 15 секунд.

Одна вещь, которую я хотел бы знать раньше

Никогда не повышайте масштаб JPEG, если этого можно избежать. Я делал это месяцами, потому что Я не осознавал, что Midjourney по умолчанию использует JPEG для некоторых выходных данных. Артефакты сжатия незначительны при разрешении 1024x1024, но когда вы убираете Увеличьте изображение в 4 раза, они станут видимыми. Вы начинаете видеть блочные артефакты в плавные градиенты и звон вокруг острых краев.

Всегда экспортируйте в формате PNG из Discord или любого другого интерфейса Midjourney. использовать. Если у вас есть только JPEG, его все равно стоит масштабировать. Результаты будет лучше, чем не масштабировать. Но исходные файлы PNG дают вам заметно более чистый результат в разрешении 4K. Я усвоил это на собственном горьком опыте после тратить около 20 кредитов на масштабирование JPEG, которое в полной мере выглядело посредственно разрешение.

А как насчет Midjourney V7 и более новых версий?

Я протестировал этот рабочий процесс на выходных данных V5, V6 и V7. Улучшение от внешнего масштабирования одинаково во всех версиях. V7 генерирует более качественные базовые изображения, чем V6, который генерирует более качественную базу. изображения, чем V5. Но фундаментальное ограничение встроенного апскейлера то же самое. Он сглаживает текстуры, которые вы хотите сохранить.

Я подозреваю, что это будет верно и для будущих версий. Midjourney – это генератор изображений в первую очередь. Их апскейлер - это удобная функция, а не профессиональный инструмент. Пока вы относитесь к этому таким образом и используете внешний апскейлер для всего, что вам важно, с вами все будет в порядке.

Если вы полагались на встроенный апскейлер Midjourney и задаетесь вопросом, почему ваши отпечатки выглядят мягкими, попробуйте пропустить одно изображение через внешний 4-кратный апскейл и сравните их друг с другом. Разница в том, не тонкий.