• 学习DiscoDiffusion的最基础操作


    目标

    Disco Diffusion 是一个AI绘图工具,通过一句话就可以让AI画出符合描述的图片,网上可以看到很多令人惊叹的结果。

    我也想尝试一下这个神奇的技术,本篇目标是学习使用它的基础操作。
    主要参考的教程是:Quick & Easy Tutorial for Disco Diffusion Google Colab (Make your own pictures!). - YouTube

    由于是在 Google Colab 上,所以如果对它一无所知,最好简单了解下相关的基础概念(见前一篇

    0. 基础信息

    本篇将使用的 Disco Diffusion 的 GoogleColab地址是:
    Disco Diffusion v5.4 [Now with Warp] - Colaboratory
    (原教程的版本是 4.1,但是我尝试后有报错,所以最后换成了这个5.4版本)


    随后,可以将其复制到自己的GoogleDrive网盘中。
    在这里插入图片描述

    之后就可以在自己的网盘中打开了。本篇后续操作也是在自己网盘中做的。


    正如前一篇所说,它是Jupyter Notebook,所以要做的就是配置这个文档中的基础设置,然后运行这个文档。

    文档的目录结构如下:
    在这里插入图片描述

    接下来就是需要在其中做些最基本的设置了。

    1. 设置:名字、步数、尺寸

    这些设置在 Settings

    这里有三个基础的参数注意:
    在这里插入图片描述

    bathch_name:这次运行的名字,也是之后会保存在云盘里的名字

    steps:要运行的步数。步数越多则细节程度越高,教程中给出的示例:
    在这里插入图片描述
    当然,步数越高则耗时越长,所以对于一幅图片需要找到最合适的步数。

    width_height:图片长宽。必须是64的倍数

    2. 设置:保存间隔

    这个设置在 Settings 中的 ExtraSettings 中:
    在这里插入图片描述intermediate_saves 将控制中间保存几次。比如我这里填9,那么在我的云盘上除了会看到最后一张结果外,还可以看到中间运算过程中保存的9张。

    3. 设置:核心的Prompts

    它在 Settings 中的 Prompts 中。

    当然,他就是最核心的了。对于这个参数,文档中的描述是:

    text_prompts: A description of what you’d like the machine to generate. Think of it like writing the caption below your image on a website. 你希望机器生成的内容的描述。可以想象是,如果这个图片出现在网站上,那么它的标题是什么。

    在这里插入图片描述

    例如,我这里是:
    “a huge panda is destroying alien base”, “Technology and Fantasy”
    “大熊猫正在摧毁外星人基地”,“科技与奇幻”

    4. 设置:显示间隔,批数目

    这些设置在Diffuse中:
    在这里插入图片描述
    display_rate :没间隔几步就在Colab中显示
    n_batches:总共运算几批(即输出几次完全不同的图片)

    5. 开始运行!

    在最上面,找到“全部运行”的按钮:
    在这里插入图片描述
    随后会弹出一些提示。
    比如
    在这里插入图片描述
    还有些人机验证
    在这里插入图片描述
    还有关联GoogleDrive的提示:
    在这里插入图片描述

    等都搞定后,就开始运行这个文档中的代码了。
    开始会需要几分钟等待安装所依赖的数据。
    之后就可以在最下方看到计算的进展了:
    在这里插入图片描述

    6. 结果

    运行完成后(大约经历了40分钟),就可以在自己的网盘中找到输出的图片了:
    在这里插入图片描述
    (其中 partials 文件夹存储了中间的过程)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    评价下这个结果:
    感觉 “外星人基地” 这感觉是有了,“熊猫”这个“巨大”的特征也能看出来,黑白的特征也能看出来,不过熊猫自己的细节,有点太抽象了(笑)。

    总结

    1. 这个是基于 GoogleColab 的,所以最好了解下基础概念,(见前一篇
    2. 到 DiscoDiffusion 的 GoogleColab地址,将其复制到自己的GoogleDrive网盘中。
    3. 打开自己网盘中的DiscoDiffusion副本,做最基础的设置,核心设置是 prompts。
    4. 点击运行,然后就可以在自己的GoogleDrive网盘中看到结果。

    其他参考资料

    新浪微博@Simon_阿文里有很多相关的资料,本篇的教程也是在这里看到的。
    人工智能绘画工具 Disco Diffusion 入门教程 - 哔哩哔哩 也是一篇类似的中文教程,可以参考。

  • 相关阅读:
    如何理解attention中的Q、K、V
    Pymoo:优化算法收敛性的实例分析
    【题解】同济线代习题二 8.1
    最简单的共享列表服务器KissLists
    C#/WPF/.NET 找到的程序集清单定义与程序集引用不匹配
    数二思维导图
    Android开发----实现登录注册页面(创建本地数据库,对注册的账户密码进行存储)
    rsync 备份工具(附rsync+inotify 实时同步部署实例)
    AntBlazor Theme in ABP Framework
    QMI8658A Datasheet Rev A-勘误表
  • 原文地址:https://blog.csdn.net/u013412391/article/details/125458801