构建视频搜索和摘要 (VSS) 智能体

在 Spark 上运行 VSS 蓝图

基本思路

部署 NVIDIA 的视频搜索和摘要 (VSS) AI Blueprint来构建结合了视觉语言模型、大型语言模型和检索增强生成的智能视频分析系统。该系统通过视频摘要、问答和实时警报将原始视频内容转化为实时可操作的见解。您将设置完全本地的 Event Reviewer 部署或使用远程模型端点的混合部署。

你将完成什么

您将在采用 Blackwell 架构的 NVIDIA Spark 硬件上部署 NVIDIA 的 VSS AI Blueprint,并在两种部署方案之间进行选择:VSS Event Reviewer(使用 VLM 管道完全本地化)或标准 VSS(使用远程 LLM/嵌入端点的混合部署)。这包括设置警报桥、VLM 管道、警报检查器 UI、视频存储工具包和可选的 DeepStream CV 管道,以进行自动视频分析和事件审查。

开始之前需要了解什么

  • 使用 NVIDIA Docker 容器和容器注册表
  • 使用共享网络设置 Docker Compose 环境
  • 管理环境变量和身份验证令牌
  • 对视频处理和分析工作流程的基本了解

先决条件

  • 具有 ARM64 架构和 Blackwell GPU 的 NVIDIA Spark 设备
  • DGX 操作系统(建议:7.4.0 或更高版本)
  • 安装的驱动程序版本 580.95.05 或更高版本:nvidia-smi | grep "Driver Version"
  • 安装的 CUDA 版本 13.0:nvcc --version
  • Docker 安装并运行:docker --version && docker compose version
  • 使用 NGC API Key 访问 NVIDIA 容器注册表
  • NVIDIA 容器工具包
  • [可选] 用于远程模型端点的 NVIDIA API 密钥(仅限混合部署)
  • 足够的视频处理存储空间(/tmp/中建议>10GB)

附属文件

时间与风险

  • 持续时间: 初始设置 30-45 分钟,视频处理验证需要额外时间
  • 风险:
    • 由于模型下载量较大,容器启动可能会占用大量资源且耗时
    • 如果共享网络已存在,网络配置会发生冲突
    • 远程 API 端点可能存在速率限制或连接问题(混合部署)
  • 回滚: 使用 scripts/dev-profile.sh down 停止所有容器
  • 最后更新: 2026 年 3 月 16 日
    • 更新所需的操作系统和驱动程序版本
    • 通过 Cosmos Reason 2 VLM 支持 VSS 3.1.0