尽可能收集不同景别、角度、光影
原图分辨率越高越好
避免模糊图片
训练人物时尽量避免遮挡,和过多的背景元素
图片不是越多越好
描述要与图像一致
精细度越高,图片越复杂,repeat也要越高
过拟合(固化)
欠拟合(不像)
与repeat相似,没有最高最低,只有最优(玄学)
多轮次比单轮次得到更多的模型
同等总学习步数下时间更少
拟合性比单轮次好
设置仅供参考
速度加快
收敛变慢
total optimiztion steps(学习步数)
total steps=image*repeat/batch_size
1e-4
使用时会覆盖learning rate
1e-4
有助于学习文本编码器(对tag更加敏感)
5e-5
(Network dimension)Dim(学习精细度)
维度提升有助于学会更多细节,但收敛会变慢,时间更长,也更容易过拟合
32
32-128
>128
1e-4
优化器自动调整学习率。学习率选项指定的值不是学习率本身,而是D-Adaptation决定的学习率的应用率,所以通常指定1.0
采样DA决定的最优学习率的1/3
概要