使用 PyTorch 进行微调

使用 PyTorch 在本地微调模型

基本思路

本手册将引导您设置和使用 PyTorch 在 NVIDIA Spark 设备上微调大型语言模型。

你将完成什么

您将在 NVIDIA Spark 设备上为大型语言模型(1-70B 参数)建立完整的微调环境。
最后,您将拥有一个支持参数高效微调 (PEFT) 和监督微调 (SFT) 的有效安装。

开始之前需要了解什么

  • 具有 PyTorch 微调经验
  • 使用 Docker

先决条件

配方专门针对 DGX SPARK。请确保操作系统和驱动程序是最新的。

附属文件

微调所需的所有文件都包含在 GitHub 仓库 文件夹中。

时间与风险

  • 时间估计: 30-45 分钟用于设置和运行微调。微调运行时间根据模型大小而变化
  • 风险: 模型下载可能很大(数 GB),ARM64 软件包兼容性问题可能需要进行故障排查。
  • 最后更新: 2025 年 1 月 15 日
    • 添加两个Spark分布式finetuning示例
    • 添加详细说明以在 Llama3 3B、8B 和 70B 模型上运行完整的 SFT、LoRA 和 qLoRA 工作流程。