[sd_scripts]之fine_tune

https://github.com/kohya-ss/sd-scripts/blob/main/docs/fine_tune_README_ja.mdhttps://github.com/kohya-ss/sd-scripts/blob/main/docs/fine_tune_README_ja.md

fine-tune微调是指使用图像和文本对来训练模型，不包括lora、textual inversion和hypernetwork。

对stable diffusion的unet进行微调，对应NovelAI的改进：

1.使用clip文本编码器倒数第二层的输出，而不是最后一层。

clip将文本转换为特征，sd中使用clip最后一层输出，但可以更改为使用倒数第二层的输出，NovelAI称这将更准确的反应提示，在sd2.0中，默认使用倒数第二层，不要指定clip_skip。

2.非正方形分辨率训练（Aspect Ratio Bucking）。

sd采用了512×512的分辨率进行训练，同时也会在256×1024、384×640等分辨率下进行训练。这样可以减少被裁剪的部分，更准确地学习提示和图像之间的关系。训练分辨率将根据给定分辨率进行64像素的垂直和水平调整，确保不超出范围。通常情况下，统一输入大小是常见的做法，只要在同一batch内保持一致即可。NovelAI所说的bucketing（分桶）是指根据长宽比对训练数据分类，并通过每个bucket内的图像创建batch来统一batch的图像大小。

3.token长度从75扩展到225。

sd中，token最多75（77个，包括起始和结束符），将其扩展到225，clip接受的最大长度是75个token，因此在225的情况下，需要将其分成三段，调用clip，然后连接结果。在webui中是根据逗号进行分割的。

4.使用blip、DeepDanbooru、WD14Tagger自动生成标题。

5.bs，因为学习整个模型，所以和lora等相比，fine-tune消耗更多的内存。

6.一般学习率，1e-6到5e-6很常见，从llm那边的经验，可能微调包括lora等，lr还是低一些好。

7.train_text_encoder，内存会增加，在正常微调中，text encoder不是学习目标，但是当训练数据较少时，text encoder像dreambooth那样训练也有效。默认情况不执行text encoder的训练，通常对模型训练时，只训练unet。

8.使用diffusers_xformers.

9.训练


accelerate launch --num_cpu_threads_per_process 1 fine_tune.py 
    --pretrained_model_name_or_path=model.safetensors
    --output_dir= 
    --output_name=
    --dataset_config=
    --save_model_as=safetensors 
    --learning_rate=5e-6 
    --max_train_steps=10000 
    --use_8bit_adam 
    --xformers 
    --gradient_checkpointing
    --mixed_precision=fp16

--num_cpu_threads_per_process：

--pretrained_model_name_or_path：指定训练的模型，.ckpt或者.safetensors，hf格式均可。

--output_dir：指定保存的模型文件夹。

--output_name：指定不带扩展名的文件夹。

--save_model_as：保存的格式

--dataset_config：指定.toml文件。

--max_train_steps：学习的步数10000

--learning_rate：5e-6

相关阅读:
Ubuntu20.04 如何开启root账户登陆
论文分享 | 利用单模态自监督学习实现多模态AVSR
初探富文本之富文本概述
Maven&MyBatis
Magisk V26.3卡刷包APK最新版下载-支持payload.bin自动维补ROOT
43%非常看好TypeScript…解读“2022前端开发者现状报告”
Linux之父一语成谶：Valve拯救桌面版Linux，但新版本仍在分裂其生态
领航未来，2022 世界人工智能大会「元宇宙的数字原生进化」论坛等你来！
【ARMv8 SIMD和浮点指令编程】NEON 加载指令——如何将数据从内存搬到寄存器（LDx&LDxR）？
[RTOS 学习记录] 工程管理工具make及makefile

原文地址：https://blog.csdn.net/u012193416/article/details/134318786