码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【每周CV论文推荐】GAN与VAE的结合,有哪些必读的论文?


    欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

    VAE和GAN是两类最具有代表性的生成式模型,其中VAE是典型的显式生成模型,GAN是典型的隐式生成模型,两者的结合又可以产生什么样的火花呢,本次我们来介绍其中值得阅读的文章。

    作者&编辑 | 言有三

    1 VAE论文

    基本的GAN模型大家还是比较熟悉的,而变分自编码器(Variational Auto-Encoder,简称VAE)有许多朋友可能并不熟悉,因此大家还需要先了解其基本原理,阅读原始论文。

    文章引用量:22000+

    推荐指数:✦✦✦✦✦

    a0060975ab95c23a3a32ea914a860cc2.png

    [1] Kingma D P, Welling M. Auto-encoding variational bayes[J]. arXiv preprint arXiv:1312.6114, 2013.

    2 对抗自编码器

    Adversarial Autoencoders的核心仍然是利用一个生成器G和一个判别器D进行对抗学习,以区分real data和fake data,但是差别在于这里需要判别真假的data并不是自然图像,而是一个编码向量z,对应的real data和fake data分别由autoencoder中的encoder和一个预定义的随机概率分布生成,最后用于image generation的网络也并非是之前的生成器G,而是autoencoder中的decoder。

    文章引用量:2400+

    推荐指数:✦✦✦✦✦

    f3ac0fcda5b051e7200e8de67ee55215.png

    [2] Makhzani A, Shlens J, Jaitly N, et al. Adversarial autoencoders[J]. arXiv preprint arXiv:1511.05644, 2015.

    3 ALI与BiGAN

    Adversarially Learned Inference(简称ALI)与Adversarial feature learning(简称BiGAN)类似,GAN中的生成器实现了从Latent向量空间z到图像空间x的转换,ALI和BiGAN模型则添加了图像空间x到Latent向量空间z的转换。判别器不仅需要学习区分生成的样本和真实的样本,还需要区分两个不同的数据和潜在变量联合分布。

    文章引用量:3000+

    推荐指数:✦✦✦✦✦

    1791d82466a054c9039dd9d79fd2c3a5.png

    [3] Dumoulin V, Belghazi I, Poole B, et al. Adversarially Learned Inference[J]. arXiv: Machine Learning, 2016

    [4] Donahue J, Krähenbühl P, Darrell T. Adversarial feature learning[J]. arXiv preprint arXiv:1605.09782, 2016. 

    4 VEEGAN 

    VEEGAN是一个用于减少GAN模型训练过程中过拟合程度的框架,它通过额外添加的Autoeencoder损失来实现,其损失是一个两个联合分布(真实数据与编码器输出,噪声向量与生成器输出)的KL散度。

    文章引用量:500+

    推荐指数:✦✦✦✦✧

    272ca0e7b2ad82f1b6ab3010e500747c.png

    [5] rivastava A, Valkov L, Russell C, et al. Veegan: Reducing mode collapse in gans using implicit variational learning[J]. Advances in neural information processing systems, 2017, 30.

    5 AVB

    Adversarial variational bayes(简称AVB)采用对抗学习的方式来训练变分自编码器,可以任意的使用复杂的推理模型,能够学习丰富的后验分布,并证明该模型能够为复杂的数据集生成样本。

    文章引用量:500+

    推荐指数:✦✦✦✦✧

    d4e392eea2dde3adb33163b76d569960.png

    [6] Mescheder L, Nowozin S, Geiger A. Adversarial variational bayes: Unifying variational autoencoders and generative adversarial networks[C]//International conference on machine learning. PMLR, 2017: 2391-2400.

    6 AGE

    ALI包含了编码器,解码器和判别器,但是有研究表明,没有判别器也是可以的,这就是Adversarial Generator-Encoder Networks,可以减少模型的总体参数量,与ALI模型和VAE模型进行了对比,相比于VAE拥有更好的细节,相比于ALI则拥有更精确的重建结果。

    文章引用量:100+

    推荐指数:✦✦✦✦✧

    8afc1c0f69dc7ce1c10f2811405978d1.png

    [7] Ulyanov D, Vedaldi A, Lempitsky V, et al. It Takes (Only) Two: Adversarial Generator-Encoder Networks[J]. arXiv: Computer Vision and Pattern Recognition, 2017.

     7 如何进行实战

    为了帮助大家掌握一些图像生成模型的重要方法,我们推出了相关的专栏课程《深度学习之图像生成GAN:理论实践篇》,可以进一步阅读:

    【视频课】CV必学,超6小时,2大模块,循序渐进地搞懂GAN图像生成!

    88978941291f8206ce0ffde5f2207037.png

    45a7cf677e222661615a8a15f951e8e6.jpeg

    总结

    本次我们简单介绍了GAN与VAE结合的一些研究,这是两类非常具有代表性的生成模型,对于从事图像生成相关领域的朋友,是必须掌握的基础内容。

    有三AI秋季划-GAN组

    b86bea7e24ec5429bac2691145383a8f.png

    如果想要永久系统性地跟随我们社区学习GAN的相关内容,请关注有三AI-CV秋季划GAN组,阅读了解下文:

    e5d8532d98b64f3893626c9ae45f51e4.png

    【CV秋季划】生成对抗网络GAN有哪些研究和应用,如何循序渐进地学习好(2022年言有三一对一辅导)?

    转载文章请后台联系

    侵权必究

    541212dd2a16611861f72fa6538fa930.gif

    d55b854a9aef9da692bbd3c834c14a82.png

    365b950d0f7af0982cd18c0e110a8eaa.png

    往期相关精选

    • 【每周CV论文推荐】 掌握残差网络必读的10多篇文章

    • 【每周CV论文推荐】 初学者必须精读的5篇深度学习优化相关文章

    • 【每周CV论文推荐】 CV领域中数据增强相关的论文推荐

    • 【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章

    • 【每周CV论文推荐】 初学目标检测必须要读的文章

    • 【每周CV论文推荐】 初学深度学习图像分割必须要读的文章

    • 【每周CV论文】初学实例分割需要读哪些文章?

    • 【每周CV论文推荐】 初学GAN必须要读的文章

    • 【每周CV论文推荐】 深度学习人脸检测入门必读文章

    • 【每周CV论文推荐】 初学深度学习人脸关键点检测必读文章

    • 【每周CV论文推荐】 初学深度学习人脸识别和验证必读文章

    • 【每周CV论文推荐】 初学深度学习人脸属性分析必读的文章

    • 【每周CV论文推荐】 初学活体检测与伪造人脸检测必读的文章

    • 【每周CV论文推荐】 初学深度学习单张图像三维人脸重建需要读的文章

    • 【每周CV论文推荐】 人脸识别剩下的难题:从遮挡,年龄,姿态,妆造到亲属关系,人脸攻击

    • 【每周CV论文推荐】换脸算法都有哪些经典的思路?

    • 【每周CV论文推荐】初学人脸属性编辑都有哪些值得阅读的论文?

    • 【每周CV论文推荐】初学模型可视化分析有哪些值得阅读的论文?

    • 【每周CV论文】深度学习文本检测与识别入门必读文章

    • 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始

    • 【每周CV论文】初学GAN图像风格化必须要读的文章

    • 【每周CV论文】初学深度学习图像超分辨应该要读的文章

    • 【每周CV论文】初学深度学习图像对比度增强应该要读的文章

    • 【每周CV论文】初学深度学习图像修复应该要读的文章

    • 【每周CV论文】初学深度学习图像风格化要读的文章

  • 相关阅读:
    springBoot集成websocket实现消息实时推送提醒
    每日三问-前端(第二十期)
    记一次Docker容器失败的逃逸
    PyTorch搭建CNN-LSTM混合模型实现多变量多步长时间序列预测(负荷预测)
    SOME/IP 协议介绍(二)
    前端拿到url地址拼接的参数
    JSR303是啥?有啥用处?
    【python】python内置函数——zip()打包可迭代对象为一个个元组,并返回这些元组组成的列表
    安装React脚手架
    【微服务】服务网关----Gateway
  • 原文地址:https://blog.csdn.net/hacker_long/article/details/126736813
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号