目录

stable diffusion快速入门到精通


I’m running LLaMA-65B on a single A100 80GB with 8bit quantization. $1.5/hr on vast.ai


  • 使用 ChilloutMix + 自定义数据集进行二次训练,生成图片具备原始模型能力并体现个性化特征
  • 环境推荐:1/6 GPU + 8GB 显存机器
  • 启动方式:运行 webui.sh 启动,安装插件,prompt 提示词控制生成内容与风格
  • Prompt = 生成目标
  • Negative Prompt = 避免内容
  • ChatGPT 可辅助提示词撰写

示例 LORA:

  • 训练于 sd1.5,关键词“女孩”“女人”,也支持 taiwanDollLikeness_v10
  • ChilloutMix 配合效果好
  • 建议使用 DPM++ SDE Karras、Euler a 等采样器

推荐设置:

  • txt2img 权重 0.5~0.8
  • img2img 权重 0.4~0.8

pushd D:\Software\AI\DeepFaceLab_NVIDIA_RTX2080Ti_Maozhihanhua\workspace
D:\Software\AI\DeepFaceLab_NVIDIA_RTX2080Ti_Maozhihanhua\_internal\clear_local_env.bat
D:\Software\AI\DeepFaceLab_NVIDIA_RTX2080Ti_Maozhihanhua\_internal\setenv.bat
模型名格式特点
chilloutmix_NiPrunedFp32Fix.safetensorsChill风格优化,剪枝处理
yesmix_v16Original.safetensorsYes Mix 风格,原始版本
beautifulRealistic_v60.safetensors美观逼真风格
GuoFeng3.ckpt东方风格模型
byssOrangeMix2_sfw.ckpt卡通二次元风格
  • .ckpt:原始格式,包含完整网络结构
  • .safetensors:优化后格式,加载更快,适用于部署
  • LoRA:微调模型,需与 Base 模型联合使用,实现特定风格或人物图像
  • VAE:压缩图像信息,起滤镜作用,影响颜色风格
  • pt 文件:嵌入式引导,用于精确控制输出内容
  1. 上传清晰正脸图片
  2. “Encode” 模块中点击 Encode
  3. 生成 encoded_image.pt
  4. 设置 > Face Restoration > Input Image 路径粘贴
  5. 保存配置,即可复用该人脸信息生成不同造型

python\python.exe venv\Lib\site-packages\flatbuffers\encode.py "D:\Software\AI\roop\resource\roop\test\梓涵大大\23.jpg" -o 23.pt
import torch

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
torch.backends.cudnn.benchmark = True
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.max_workspace_size = 256

相关内容