使用 Ollama 运行 Open WebUI

安装 Open WebUI 并使用 Ollama 与 Spark 上的模型聊天

基本思路

Open WebUI 是一个可扩展、自托管的 AI 界面,完全离线运行。
本手册向您展示了如何在 DGX Spark 设备上部署带有集成 Ollama 服务器的 Open WebUI,该设备允许您在模型在 Spark 的 GPU 上运行时从本地浏览器访问 Web 界面。

你将完成什么

您将在 DGX Spark 上运行功能齐全的 Open WebUI 安装。这可以通过您的本地 Web 浏览器通过 NVIDIA Sync 的托管 SSH 隧道(推荐) 或通过手动设置进行访问。该设置包括用于模型管理的集成 Ollama、持久数据存储和用于模型推理的 GPU 加速。

开始之前需要了解什么

先决条件

时间与风险

  • 预计时间:初始设置需要 15-20 分钟,加上模型下载时间(因模型大小而异)
  • 风险
    • Docker 权限问题可能需要更改用户组并重新启动会话
    • 大型模型下载可能需要大量时间,具体取决于网络速度
  • 最后更新: 2025 年 10 月 28 日
    • 少量文案编辑