如何将 Midjourney 图片放大到 4K 而不丢失细节
Midjourney 自带的放大功能会抹掉那些让你的作品栩栩如生的纹理。这里有一套工作流程,能在 4K 分辨率下保留这些细节。
去年我搞砸了一次画廊投稿。不是作品本身不好。我花了三天时间生成和筛选 Midjourney 作品,准备参加本地一个群展。构图完全符合我的想法。然后我用 Midjourney 自带的放大功能把它们全部放大了,发给了打印店。
当测试打印样回来的时候,我几乎认不出来了。所有的织物纹理都没了。我喜欢的氛围雾气被压平成了光滑的渐变。每张肖像上的皮肤看起来都像手机美颜滤镜开到了最大。我不得不退出了那次展览。
那是我意识到 Midjourney 自带的放大功能和真正的外部放大工具是完全不同的东西。如果你只是为 Instagram 做图,自带工具够用了。如果你想打印、卖印刷品、或者在全分辨率下展示你的作品,你需要一个不同的方案。
Midjourney 的放大功能到底做了什么
Midjourney 提供了几种放大模式。Subtle、Creative 和更早的 V5 版本。它们的工作原理都是一样的。模型看着你的图片,试图整体改进它。锐化、平滑、调整整体构图。
问题在于"整体"意味着它分不清哪些东西你应该想平滑,哪些你应该想保持锐利。嘈杂的背景应该平滑。亚麻衬衫的编织纹理不应该。Midjourney 对它们一视同仁。
我注意到这一点最多的是在有复杂材质的图片上。皮革看起来像棕色塑料。羊毛纹理完全消失了。任何有次表面散射的东西,比如皮肤或蜡烛,都被压成了单一的平面质感。
专用外部放大工具可以解决这个问题
像 Real-ESRGAN 这样的外部放大工具训练方式不同。它不是在试图一次性改善整张图片,而是通过数百万张照片对来学习一项特定的技能。给一张低分辨率图像,它的高分辨率版本应该是什么样子?它学会了预测哪里应该存在细节,并逐像素生成。
区别在纹理上最明显。这是我用两种方法测试同一张 1024x1024 的 Midjourney 输出时的发现。
Midjourney 放大一张穿羊毛大衣的老人的肖像。乍一看脸还行,但放大看。那些让他看起来真实的毛孔和细纹全没了。羊毛大衣变成了一个棕色色块,看不到任何编织纹理。看起来像 2016 年的高质量游戏渲染,而不是一张可以打印的艺术品。
同样的图片通过 Real-ESRGAN 4倍放大。毛孔还在。你能看到一根根羊毛纤维。衣领上的缝线清晰到可以数线头。看起来还是同一个人,同一件大衣。只是更清晰了。更真实了。在 4096x4096 下,它已经准备好用 300 DPI 打印 13 英寸了。
我现在用的工作流程
我把它做得很简单,因为我学到了增加步骤通常会让事情变糟,而不是变好。这是我为每张打算打印或出售的作品所做的。
第一步,我下载最高分辨率的 Midjourney 输出。通常是 1024x1024 或 1664x1088,取决于长宽比。一定要下载为 PNG。JPEG 压缩会在这个阶段引入瑕疵,在放大时会被增强。
第二步,我上传到外部放大工具,运行 4 倍放大。每张图片大约需要五到八秒。在使用 Real-ESRGAN 的平台上花费 4 个积分。结果是 4096x4096 的图片,在 300 DPI 下可以打印 13.6 英寸。对大多数画廊展览和艺术印刷来说足够了。
第三步,检查面孔。如果 Midjourney 生成图里有人物,放大步骤有时会稍微柔化面部细节。这种情况下我会用 GFPGAN 单独做一个面部修复。这要额外 4 个积分。如果图里没有面孔或面孔已经够清晰了,我就跳过这一步。
这就是全部流程。导出 PNG,放大 4 倍,可选的修复面孔。大多数图片只需两步,如果有人物就三步。总花费是 4 或 8 个积分,取决于有没有人物。总处理时间不到 15 秒。
一个我希望早点知道的事
如果可以避免,永远不要放大 JPEG。我这么干了好几个月,因为我不知道 Midjourney 某些输出默认是 JPEG。在 1024x1024 下压缩痕迹不明显,但当你把图像放大 4 倍时,它们就变得可见了。你会开始在平滑渐变中看到块状痕迹,在锐利边缘周围看到振铃效应。
一定要从 Discord 或你用的任何 Midjourney 界面导出为 PNG。如果你只有 JPEG,放大还是值得做。结果会比不放大好。但 PNG 源文件在全分辨率下的输出明显更干净。我在浪费了大约 20 个积分放大 JPEG 后才发现,那些放大效果在全分辨率下看起来很平庸。
Midjourney V7 和更新版本呢
我测试过这个流程在 V5、V6 和 V7 的输出上。外部放大的改善在所有版本上都是一致的。V7 生成的基础图像比 V6 好,V6 比 V5 好。但内置放大功能的根本限制是一样的。它会抹掉你想保留的纹理。
我觉得这对未来的版本也一样。Midjourney 首先是一个图像生成器。他们的放大功能是一个便利特性,而不是专业工具。只要你把它当便利特性对待,对于你在意的东西使用外部放大工具,就不会有问题。
如果你一直依赖 Midjourney 自带的放大功能,还想知道为什么你的打印品看起来很柔和,试试拿一张你用外部 4 倍放大出来的图放在一起对比。差别不是微妙的。