FLUX.1 Dreambooth LoRA 微调

使用 Dreambooth LoRA 微调 FLUX.1-dev 12B 模型,以生成自定义图像

基本思路

本 playbook 演示如何在 DGX Spark 上使用多概念 Dreambooth LoRA(Low-Rank Adaptation)对 FLUX.1-dev 12B 模型进行微调,以实现自定义图像生成。
DGX Spark 拥有 128GB 统一内存和强大的 GPU 加速能力,非常适合在内存中同时加载多个模型进行训练,例如 Diffusion Transformer、CLIP Text Encoder、T5 Text Encoder 和 Autoencoder。

多概念 Dreambooth LoRA 微调允许你为 FLUX.1 教会新的概念、角色和风格。训练得到的 LoRA 权重可以轻松集成到现有 Comfy UI 工作流中,非常适合做原型验证和实验。
此外,这个 playbook 还展示了 DGX Spark 不仅可以在内存中加载多个模型,还能够训练并生成 1024px 及以上的高分辨率图像。

你将完成的内容

你将得到一个已完成微调的 FLUX.1 模型,能够生成包含自定义概念的图像,并可直接用于 Comfy UI 工作流。
本环境包括:

  • 使用 Dreambooth LoRA 技术对 FLUX.1-dev 模型进行微调
  • 基于自定义概念("tjtoy" 玩具和 "sparkgpu" GPU)进行训练
  • 进行 1K 高分辨率扩散训练与推理
  • 集成 Comfy UI 以支持直观的可视化工作流
  • 通过 Docker 容器化实现可复现环境

前置条件

  • DGX Spark 设备已完成设置并可访问
  • DGX Spark 的 GPU 上没有其他进程在运行
  • 有足够磁盘空间用于下载模型
  • 已安装并配置 NVIDIA Docker

时间与风险

  • 耗时:
    • 初始环境准备和模型下载约 30-45 分钟
    • Dreambooth LoRA 训练约 1-2 小时
  • 风险:
    • Docker 权限问题可能需要修改用户组并重启会话
    • 若想获得最佳效果,该方案通常需要进行超参数调优并准备高质量数据集
  • 回滚: 停止并删除 Docker 容器;如有需要,可删除已下载模型。
  • 最后更新: 11/07/2025
    • 文案小幅修订