RePaint
(图片)+Mask->DDPM-> 条件图片,图生图
(图片)+Mask->DDPM-> 条件图片,图生图
两层的神经网络,即输入层和输出层,训练时包括 2 个方向,从输入层到输出层 + 从输出层到输入层
从低分辨率训练生成器,使得 GAN 训练更加稳定
改进 PixelCNN ,将原始 256-way 灰度级 softmax 输出改为连续分布输出
借助 NLP 循环输入预测下一字词的特点,通过定义掩码卷积,使用以前的像素预测下一像素
第一个像素 -> 完整图片,随机图片
本文提出了风格迁移中一种重要的损失函数,感知损失,使得模型生成的图片和目标风格更像
图 A + 图 B-> 图 A 参考图 B 风格,图生图
基于 Conditional Diffusion 的图片编辑应用,主要应用:图片上色(Colorization)、图片涂抹(Inpainting)、图片去裁剪(Uncropping)、JPEG 反压缩(JPEG decompression)
图片 A->VAE encoder->z + 噪声 ->z’->VAE decoder-> 图片 A’,条件图片