码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 扩散模型——下一个图像生成热点,快上车!!!


    文章目录

    • 理论
      • 扩散模型概述
        • 优势
      • 扩散阶段
        • 如何扩散第一步
      • 重建阶段
      • 总结
    • 代码
    • 应用

    理论

    基础和综述

    细节讲解-什么是扩散模型

    B站详细讲解-从零开始了解扩散模型

    扩散模型概述

    DDPM Nips2020去噪工作

    • 步骤

    扩散和重建两个过程

    • training phase

    训练集合中获取真实数据集,使用扩散模型得到很多噪声图,使用噪声图进行重建得到高清图片;

    • test phase

    使用高斯分布采样噪声图,将噪声图采样得到真实人脸(生成结果)

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tCl7UCUp-1667301581205)(images/oYyqT8EXZOXsNvszL445X0uZMtDJu3hi3EketoNaZxg.png)]

    优势

    相比GAN容易崩塌,扩散模型相对更加稳定。

    扩散模型更加具有指向性,具有比较好的针对性!

    扩散阶段

    将真实图片输入,使用扩散方式加入噪声,通过不断迭代多次,最终得到噪声图片;

    如何扩散第一步

    一个DDPM由两个参数化马尔可夫链组成,并使用变分推断以在有限时间后生成与原始数据分布一致的样本。前向链的作用是扰动数据,它根据预先设计的噪声进度向数据逐渐加入高斯噪声,直到数据的分布趋于先验分布,即标准高斯分布。反向链从给定的先验开始并使用参数化的高斯转换核,学习逐步恢复原数据分布。用表示原始数据及其分布,则前向链的分布是可由下式表达:

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GDOCHJlv-1667301581206)(images/foJ0aHdpLkcNVrHYiHkSu9j3PXme8hv7rfCDNAl-gNo.png)]

    • 如何能够一次计算将x0到xt的过程

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d1Y6vZWD-1667301581207)(images/uNmni0PpF39-WJWmPGOvBk1oloNTbPB6YSLcxjM6VEM.png)]

    扩散的过程可以理解为:

    1. 将输入真实图片,通过不断进行扩散,最终得到符合正态分布的噪声图
    2. 扩散过程中的一步,通过推导可知,其本质是将上一步的值和两个系数相乘并与乘以系数的采样值相加;
    3. 进一步推导可知,对于任意一个时间的输出,可以根据初始输入和采样噪声值与系数相乘之和得到;

    重建阶段

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9tkjfTgB-1667301581207)(images/3KfSOf4xf6p13iUlYf4W_BEYnADhoKXrVSIG5gk7g_c.png)]

    重建过程在实际应用中的过程如上图所示。

    其中,选择真实数据集中4张图,通过随机确定采样次数,利用扩散方式得到对应噪声图;

    使用UNet学习噪声图和真实图的关系并得到能有效去噪的UNet网络;

    但如果一步到位学习对应去噪网络,往往效果很有限,使用逐步反向推导的方式得到最终真实图像会有更好的结果,结构如下:

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XEBPczWw-1667301581208)(images/teO1Zhz-aViHS7wlFG3KjX8zyepE8s-m1gM4lJZn2JM.png)]

    总结

    • 扩散过程

    • 重建过程

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XzMUeMhk-1667301581208)(images/-iL-yGGhy35Fd_nmSdptftdSaPZZBH_fI6jpi2OkDrY.png)]

    代码

    各类方向代码

    基础应用-生成cifar10和mnist

    扩张模型-超分

    应用

    • High-Resolution Image Synthesis with Latent Diffusion Models 【pdf】 [code] 【论文解析】【B站讲解】
  • 相关阅读:
    虚幻C++基础 day3
    数据增强系列(补充ing...)
    三、支持向量机算法(SVC,Support Vector Classification)(有监督学习)
    LeetCode每日一题(1012. Numbers With Repeated Digits)
    SQLite导出数据库至sql文件
    构建创新增值能力优势,康铂酒店突围中端酒店市场!
    图片大小转换(对于图片进行压缩)
    spring管理bean
    MessageQueue消息队列——基础(笔记)
    双目视觉(双目相机)
  • 原文地址:https://blog.csdn.net/helloworld_Fly/article/details/127639565
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号