文章最后更新时间:
南尧派导读
最近,AI图像生成引人注目,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。Stable Diffusion作为一款高性能模型,它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小,是AI图像生成领域的里程碑。
目录
1 硬件要求
2 环境部署
2.1 手动部署
2.2 自动整合包
3 关于插件
4 文生图最简流程——重点步骤与参数
5 提示词
5.1 提示词内容
5.2 提示词语法
5.3 Token
5.4 提示词模板
6 Controlnet
6.1 基本流程
6.2 可用预处理/模型
6.3 多 ControlNet 合成
7 模型:从下载、安装、使用到训练
7.1 模型下载
7.2 模型安装
7.3 模型使用
7.4 模型训练
7.5 环境搭建
7.6 环境更新
7.7 界面启动
7.8 训练流程
8 风格训练与人物训练
建议使用不少于 16GB 内存,并有 60GB 以上的硬盘空间。需要用到 CUDA架构,推荐使用 N 卡。
提示词所做的工作是缩小模型出图的解空间,即缩小生成内容时在模型数据里的检索范围,而非直接指定作画结果。
提示词
提示词的效果也受模型的影响,有些模型对自然语言做特化训练,有些模型对单词标签对特化训练,那么对不同的提示词语言风格的反应就不同。
类型 | 要求 |
自然 语言 | 可以使用描述物体的句子作为提示词。大多数情况下英文有效,也可以使用中文。避免复杂的语法。 |
单词 标签 | 可以使用逗号隔开的单词作为提示词。一般使用普通常见的单词。单词的风格要和图像的整体风格搭配,否则会出现混杂的风格或噪点。避免出现拼写错误。 |
Emoji 颜文字 | Emoji (💰👨👩🎅👼🍟🍕) 表情符号也是可以使用并且非常准确的。因为Emoji只有一个字符,所以在语义准确度上表现良好。 |
值得注意的是,Emoji 在构图上有影响。举个例子,💐👩💐输出后:
对于使用 Danbooru 数据的模型来说,可以使用西式颜文字在一定程度上控制出图的表情。如::-) 微笑 🙁 不悦 😉 使眼色 😀 开心 😛 吐舌头 :-C 很悲伤 :-O 惊讶 张大口 :-/ 怀疑
仅供学习和研究使用,请在下载后24小时内删除
© 版权声明
THE END
暂无评论内容