在 AI Workbench 中构建 RAG 应用

安装并使用 AI Workbench 克隆并运行可重现的 RAG 应用程序

基本思路

本演练演示了如何设置和运行智能体检索增强生成 (RAG)
使用 NVIDIA AI Workbench 的项目。您将使用 AI Workbench 克隆并运行预构建的智能体 RAG
智能路由查询、评估响应的相关性和幻觉的应用程序,以及
迭代评估和生成周期。该项目使用Gradio Web界面并且可以工作
具有 NVIDIA 托管的 API 端点或自托管模型。

你将完成什么

您将拥有一个在 NVIDIA AI Workbench 中运行的功能齐全的智能体 RAG 应用程序,并带有 Web
您可以在其中提交查询并接收智能响应的界面。系统将演示
高级 RAG 功能,包括查询路由、响应评估和迭代细化,
让您亲身体验 AI Workbench 的开发环境和复杂的 RAG
架构。

开始之前需要了解什么

  • 基本熟悉检索增强生成 (RAG) 概念
  • 了解 API 密钥以及如何生成它们
  • 舒适地使用网络应用程序和浏览器界面
  • 对容器化开发环境的基本了解

先决条件

硬件要求:

  • NVIDIA Grace Blackwell GB10 超级芯片系统

软件要求:

  • NVIDIA AI Workbench 已安装或准备安装
  • 免费 NVIDIA API 密钥:在 NGC API Keys 生成
  • 免费 Tavily API 密钥:在 Tavily 生成
  • 用于克隆仓库和访问 API 的互联网连接
  • 用于访问 Gradio 界面的 Web 浏览器

验证命令

  • 验证 DGX Spark 系统上是否存在 NVIDIA AI Workbench 应用程序
  • 验证您的 API 密钥是否有效且是最新的

时间与风险

  • 预计时间: 30-45 分钟(如果需要,包括 AI Workbench 安装)
  • 风险级别: 低 - 使用预构建的容器和已建立的 API
  • 回滚: 只需从 AI Workbench 中删除克隆的项目即可删除所有组件。在 AI Workbench 环境之外不会进行任何系统更改。
  • 最后更新: 2025 年 10 月 28 日
    • 少量文案编辑