年轻人起来冲

RePaint

发表于 2023-11-28 更新于 2025-03-01 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 803 阅读时长 ≈ 1 分钟

(图片)+Mask->DDPM-> 条件图片，图生图

阅读全文 »

RBM

发表于 2023-11-27 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 520 阅读时长 ≈ 1 分钟

两层的神经网络，即输入层和输出层，训练时包括 2 个方向，从输入层到输出层 + 从输出层到输入层

阅读全文 »

ProGAN

发表于 2023-11-25 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 496 阅读时长 ≈ 1 分钟

从低分辨率训练生成器，使得 GAN 训练更加稳定

阅读全文 »

PixelCNNPlusPlus

发表于 2023-11-25 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 853 阅读时长 ≈ 1 分钟

改进 PixelCNN ，将原始 256-way 灰度级 softmax 输出改为连续分布输出

阅读全文 »

PixelCNN：Pixel Recurrent Neural Networks

发表于 2023-11-23 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 1.8k 阅读时长 ≈ 2 分钟

借助 NLP 循环输入预测下一字词的特点，通过定义掩码卷积，使用以前的像素预测下一像素
第一个像素 -> 完整图片，随机图片

阅读全文 »

PerceptualLosses：Perceptual Losses for Real-Time Style Transfer and Super-Resolution

发表于 2023-11-21 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 585 阅读时长 ≈ 1 分钟

本文提出了风格迁移中一种重要的损失函数，感知损失，使得模型生成的图片和目标风格更像
图 A + 图 B-> 图 A 参考图 B 风格，图生图

阅读全文 »

Palette：Image-to-Image Diffusion Models

发表于 2023-11-19 更新于 2025-02-02 分类于 2-深度学习， B-视觉模型， 2-高级视觉任务GAN ，生成图片本文字数： 505 阅读时长 ≈ 1 分钟

基于 Conditional Diffusion 的图片编辑应用，主要应用：图片上色（Colorization）、图片涂抹（Inpainting）、图片去裁剪（Uncropping）、JPEG 反压缩（JPEG decompression）
图片 A->VAE encoder->z + 噪声 ->z’->VAE decoder-> 图片 A’，条件图片

阅读全文 »