Comment améliorer les images Midjourney en 4K sans perdre de détails
L'upscaleur intégré de Midjourney lisse les textures exactes qui donnent à vos créations un aspect réaliste. Voici le flux de travail qui préserve réellement ces détails en 4K.
J'ai gâché une soumission de galerie l'année dernière. Pas parce que l’art était mauvais. J'avais passé trois jours à générer et à organiser les sorties Midjourney pour un exposition collective locale. Les compositions correspondaient exactement à ce que je souhaitais. Puis je les a tous mis à l'échelle à l'aide de l'upscaler intégré de Midjourney et les a envoyés envoyez-les à l’imprimeur.
Lorsque les tirages tests sont revenus, je ne les ai presque pas reconnus. Chaque morceau de tissu avait disparu. La brume atmosphérique que j'adorais avait été compressé en dégradés plats et lisses. La peau sur chaque le portrait ressemblait à un filtre de beauté de téléphone portable qui avait été activé maximum. J'ai dû me retirer du spectacle.
C'est à ce moment-là que j'ai réalisé que l'upscaler intégré de Midjourney et un un upscaler externe approprié fait des choses complètement différentes. Si vous vous créez des images pour Instagram, les outils intégrés fonctionnent bien. Si vous souhaitez imprimer, vendre des tirages ou afficher votre travail en pleine résolution, you need a different approach.
What Midjourney's upscaler actually does
Midjourney propose quelques modes de mise à l'échelle. Subtil, créatif et le anciennes variantes V5. Ils fonctionnent tous sur le même principe. Le modèle regarde votre image et essaie de l’améliorer de manière globale. Ça aiguise, lisse et ajuste la composition globale.
Le problème est que l'approche «holistique» signifie qu'il ne peut pas dire au différence entre les choses que vous voulez adoucir et les choses que vous voulez conserver pointu. Un fond bruyant doit être lissé. Le motif de tissage sur un la chemise en lin ne devrait pas l’être. Midjourney les traite de la même manière.
J'ai surtout remarqué cela sur les images avec des matériaux complexes. Le cuir est sorti ressemblant à du plastique marron. Les textures de laine ont complètement disparu. Tout ce qui est diffusé sous la surface, comme la peau ou la cire de bougie, a été aplati en une seule surface uniforme.
Un upscaler externe dédié corrige ce problème
Les upscalers externes comme Real-ESRGAN sont formés différemment. Au lieu de essayant d'améliorer l'image entière d'un coup, ils ont été formés sur des millions de paires de photos pour acquérir une compétence spécifique. Étant donné une image basse résolution, à quoi devrait ressembler la version haute résolution ? Ils apprennent à prédire où les détails devraient exister et les générer, pixel par pixel.
La différence est la plus évidente au niveau de la texture. Voici ce que j'ai vu lorsque j'ai testé la même sortie Midjourney 1024x1024 avec les deux méthodes.
Upscaler de mi-parcours sur un portrait d'un vieil homme en manteau de laine. Le le visage avait l'air bien au premier coup d'œil, mais zoomez. Les pores et les ridules qui le faisait paraître réel avait disparu. Le manteau de laine est devenu une goutte brune sans tissage visible. Cela ressemblait à un très bon rendu de jeu vidéo à partir de 2016, pas une œuvre d’art imprimable.
Même image via Real-ESRGAN à 4x. Les pores étaient là. Tu pourrais voir les fibres de laine individuelles. Les coutures sur le col du manteau étaient nettes de quoi compter les fils. Cela ressemblait toujours au même homme et le même manteau. Juste plus clair. Plus réel. À 4096x4096, il était prêt pour un Impression 13 pouces à 300 DPI.
Le flux de travail que j'utilise maintenant
Je reste simple parce que j'ai appris que l'ajout d'étapes permet généralement les choses sont pires, pas meilleures. Voici ce que je fais pour chaque pièce que je prévois de imprimer ou vendre.
Tout d'abord, je télécharge ma sortie Midjourney à la plus haute résolution disponible. Il s'agit généralement de 1 024 x 1 024 ou de 1 664 x 1 088 selon le format. rapport hauteur/largeur. Téléchargez toujours au format PNG. La compression JPEG ajoute des artefacts à ce stade, cela s'amplifie lorsque vous passez à l'échelle supérieure.
Deuxièmement, je télécharge sur un upscaler externe et j'exécute une upscale 4x. Ceci prend environ cinq à huit secondes par image. Le coût est de 4 crédits sur la plupart plates-formes qui utilisent Real-ESRGAN. Le résultat est une image 4096x4096 qui imprime à 13,6 pouces à 300 DPI. Assez bien pour la plupart des expositions en galerie et des tirages d'art.
Troisièmement, je vérifie les visages. Si la génération Midjourney avait des gens l'étape de mise à l'échelle adoucit parfois légèrement les détails du visage. Dans dans ce cas, j'exécute une passe de restauration de visage distincte en utilisant GFPGAN. Ceci coûte 4 crédits supplémentaires. Si l'image ne comporte pas de visages ou si les visages ont été déjà pointu, je saute complètement cela.
C'est tout le flux de travail. Exporter PNG, haut de gamme 4x, correction facultative visages. Deux étapes pour la plupart des images, trois s'il y a des personnes. Coût total est de 4 ou 8 crédits selon qu'il s'agit de visages. Durée totale est inférieur à 15 secondes de traitement.
Une chose que j'aurais aimé savoir plus tôt
Ne mettez jamais à niveau un JPEG si vous pouvez l'éviter. J'ai fait ça pendant des mois parce que Je n'avais pas réalisé que Midjourney utilisait par défaut JPEG pour certaines sorties. Le les artefacts de compression sont subtils à 1024x1024 mais lorsque vous soufflez le image jusqu'à 4x, ils deviennent visibles. Vous commencez à voir des artefacts en blocs dans dégradés lisses et sonneries autour des arêtes vives.
Exportez toujours au format PNG depuis Discord ou quelle que soit l'interface Midjourney dont vous disposez. utiliser. Si vous n'avez qu'un JPEG, cela vaut toujours la peine d'être mis à l'échelle. Les résultats sera mieux que de ne pas passer à l'échelle. Mais les fichiers source PNG vous donnent sortie sensiblement plus propre en 4K. J'ai appris ça à mes dépens après gaspiller environ 20 crédits sur des mises à l'échelle JPEG qui semblaient médiocres au complet résolution.
Qu'en est-il de Midjourney V7 et des versions plus récentes
J'ai testé ce workflow sur les sorties des V5, V6 et V7. Le l’amélioration de la mise à l’échelle externe est cohérente dans toutes les versions. V7 génère de meilleures images de base que V6, qui génère une meilleure base images que V5. Mais la limitation fondamentale de l'upscaler intégré c'est pareil. Il lisse les textures que vous souhaitez conserver.
Je pense que cela sera également vrai pour les futures versions. Le milieu du voyage est un générateur d'images en premier. Leur upscaler est une fonctionnalité pratique, pas un outil professionnel. Tant que vous le traitez de cette façon et que vous utilisez un upscaler pour tout ce qui vous tient à cœur, tout ira bien.
Si vous comptez sur l'upscaler Midjourney intégré et vous vous demandez pourquoi vos impressions semblent douces, essayez de faire passer une image dans un externe 4x haut de gamme et comparez-les côte à côte. La différence est pas subtil.