Como Aumentar a Escala de Imagens do Midjourney para 4K Sem Perder Detalhes
O upscaler integrado do Midjourney suaviza as texturas exatas que fazem suas criações parecerem reais. Aqui está o fluxo de trabalho que realmente preserva esses detalhes em 4K.
Eu arruinei uma inscrição para uma galeria no ano passado. Não porque a arte fosse ruim. Passei três dias gerando e fazendo curadoria de resultados do Midjourney para um show coletivo local. As composições eram exatamente o que eu queria. Então eu ampliou todos eles usando o upscaler integrado do Midjourney e enviou enviá-los para a impressora.
Quando as impressões de teste chegaram, quase não as reconheci. Cada pedaço de textura de tecido desapareceu. A névoa atmosférica que eu amei foi comprimido em gradientes planos e suaves. A pele de cada retrato parecia que um filtro de beleza de celular tinha sido acionado máximo. Eu tive que sair do show.
Foi quando percebi o upscaler integrado do Midjourney e um o upscaler externo adequado está fazendo coisas completamente diferentes. Se você estão fazendo imagens para o Instagram, as ferramentas integradas funcionam bem. Se você deseja imprimir, vender impressões ou exibir seu trabalho em resolução máxima, você precisa de uma abordagem diferente.
O que o upscaler do Midjourney realmente faz
Midjourney oferece alguns modos de aumento de escala. Sutil, Criativo e o variações V5 mais antigas. Todos eles funcionam com o mesmo princípio. O modelo olha para a sua imagem e tenta melhorá-la de forma holística. Isso aguça, suaviza e ajusta a composição geral.
O problema é que a abordagem “holística” significa que não pode dizer ao diferença entre coisas que você deseja suavizar e coisas que você deseja manter afiado. Um fundo barulhento deve ser suavizado. O padrão de trama em um camisa de linho não deveria ser. Midjourney os trata da mesma forma.
Percebi isso principalmente em imagens com materiais complexos. Couro saiu parecendo plástico marrom. As texturas de lã desapareceram completamente. Qualquer coisa com dispersão subterrânea, como pele ou cera de vela, ficou achatada em uma única superfície uniforme.
Um upscaler externo dedicado corrige isso
Upscalers externos como o Real-ESRGAN são treinados de forma diferente. Em vez de tentando melhorar toda a imagem de uma vez, eles foram treinados em milhões de pares de fotos para aprender uma habilidade específica. Dada uma imagem de baixa resolução, como deve ser a versão em alta resolução? Eles aprendem a prever onde os detalhes devem existir e gerá-los, pixel por pixel.
A diferença é mais óbvia na textura. Aqui está o que eu vi quando testei a mesma saída Midjourney 1024x1024 por meio de ambos os métodos.
Aprimoramento no meio da viagem em um retrato de um velho com um casaco de lã. O rosto parecia bem à primeira vista, mas amplie. Os poros e linhas finas que o faziam parecer real desapareceram. O casaco de lã tornou-se uma mancha marrom sem trama visível. Parecia uma renderização de videogame muito boa de 2016, não é uma obra de arte imprimível.
Mesma imagem através do Real-ESRGAN em 4x. Os poros estavam lá. Você poderia veja fibras de lã individuais. A costura na gola do casaco era nítida o suficiente para contar os fios. Ainda parecia o mesmo homem e o mesmo casaco. Apenas mais claro. Mais real. Em 4096x4096, estava pronto para um Impressão de 13 polegadas a 300 DPI.
O fluxo de trabalho que uso agora
Eu mantenho as coisas simples porque aprendi que adicionar etapas geralmente faz as coisas são piores, não melhores. Aqui está o que eu faço para cada peça que pretendo imprimir ou vender.
Primeiro, faço o download da saída do Midjourney na resolução mais alta disponível. Geralmente é 1024x1024 ou 1664x1088 dependendo do proporção de aspecto. Sempre baixe como PNG. A compactação JPEG adiciona artefatos nesta fase, que é amplificado quando você faz upgrade.
Em segundo lugar, faço upload para um upscaler externo e executo um upscale 4x. Isto leva cerca de cinco a oito segundos por imagem. O custo é de 4 créditos na maioria plataformas que utilizam Real-ESRGAN. O resultado é uma imagem de 4096x4096 que imprime em 13,6 polegadas a 300 DPI. Bom o suficiente para a maioria das exposições em galerias e impressões artísticas.
Terceiro, verifico os rostos. Se a geração Midjourney tivesse pessoas em isso, a etapa de aumento de escala às vezes suaviza ligeiramente os detalhes faciais. Em nesse caso, executo uma passagem de restauração facial separada usando GFPGAN. Isto custa mais 4 créditos. Se a imagem não tiver rostos ou os rostos foram já afiado, eu pulo isso completamente.
Esse é todo o fluxo de trabalho. Exportar PNG, upscale 4x, opcionalmente corrigir rostos. Duas etapas para a maioria das imagens, três se houver pessoas. Custo total é de 4 ou 8 créditos dependendo se os rostos estão envolvidos. Tempo total tem menos de 15 segundos de processamento.
Uma coisa que eu gostaria de saber antes
Nunca aprimore um JPEG se puder evitá-lo. Eu fiz isso por meses porque Não percebi que o padrão do Midjourney é JPEG para algumas saídas. O artefatos de compactação são sutis em 1024x1024, mas quando você explode imagem até 4x, eles se tornam visíveis. Você começa a ver artefatos em blocos gradientes suaves e toques em torno de bordas afiadas.
Sempre exporte como PNG do Discord ou qualquer interface do Midjourney que você usar. Se você tiver apenas um JPEG, ainda vale a pena fazer o upscaling. Os resultados será melhor do que não aumentar a escala. Mas os arquivos de origem PNG fornecem saída visivelmente mais limpa em 4K. Aprendi isso da maneira mais difícil depois desperdiçando cerca de 20 créditos em upscales JPEG que pareciam medíocres no total resolução.
E quanto ao Midjourney V7 e versões mais recentes
Testei esse fluxo de trabalho nas saídas de V5, V6 e V7. O a melhoria do upscaling externo é consistente em todas as versões. V7 gera melhores imagens de base do que V6, o que gera melhores imagens de base imagens do que V5. Mas a limitação fundamental do upscaler integrado é o mesmo. Suaviza as texturas que você deseja manter.
Suspeito que isso também será verdade para versões futuras. O meio da jornada é um gerador de imagem primeiro. Seu upscaler é um recurso de conveniência, não um ferramenta profissional. Contanto que você trate dessa forma e use um externo upscaler para qualquer coisa que lhe interesse, você ficará bem.
Se você confia no upscaler Midjourney integrado e perguntando por que suas impressões parecem suaves, tente passar uma imagem por um upscale 4x externo e compare-os lado a lado. A diferença é não sutil.