DGX Spark 上的文本到知识图

通过 LLM 推理和图形可视化将非结构化文本转换为交互式知识图

基本思路

本手册演示了如何构建和部署全面的知识图谱生成和可视化解决方案,为知识图谱提取提供参考。
统一内存架构支持运行更大、更准确的模型,生成更高质量的知识图并提供卓越的下游 GraphRAG 性能。

这个 txt2kg 剧本使用以下方法将非结构化文本文档转换为结构化知识图:

  • 知识三重提取:使用 Ollama 配合 GPU 加速进行本地 LLM 推理,提取主谓宾关系
  • 图数据库存储:ArangoDB用于存储和查询具有关系遍历的知识三元组
  • GPU 加速可视化:用于交互式 2D/3D 图形探索的 Three.js WebGPU 渲染

未来增强:矢量嵌入和 GraphRAG 功能是计划中的增强功能。

你将完成什么

您将拥有一个功能齐全的系统,能够处理文档、生成和编辑知识图并提供查询,并可通过交互式 Web 界面进行访问。
设置包括:

  • 本地 LLM 推理:Ollama 用于 GPU 加速的 LLM 推理,无需 API 密钥
  • 图数据库:ArangoDB,用于通过关系遍历来存储和查询三元组
  • 交互式可视化:使用 Three.js WebGPU 进行 GPU 加速图形渲染
  • 现代 Web 界面:带有文档管理和查询界面的 Next.js 前端
  • 完全容器化:通过 Docker Compose 和 GPU 支持进行可重复部署

先决条件

  • 带有最新 NVIDIA 驱动程序的 DGX Spark
  • 使用 NVIDIA Container Toolkit 安装和配置 Docker
  • Docker 组合

时间与风险

  • 期间

    • 初始设置和容器部署需要 2-3 分钟
    • Ollama 模型下载需要 5-10 分钟(取决于模型大小)
    • 即时文档处理和知识图生成
  • 风险

    • GPU 内存要求取决于所选的 Ollama 模型大小
    • 文档处理时间与文档大小和复杂性相关
  • 回滚:停止并删除 Docker 容器,根据需要删除下载的模型

  • 最后更新:2025 年 1 月 8 日

    • 从 Pinecone 迁移到 Qdrant 以实现 ARM64 兼容性
    • 添加了 Neo4j 的 vLLM 支持
    • 添加了 Palette UI 组件并改进了辅助功能
    • 添加了仅 CPU 开发模式 (./start.sh --cpu)
    • 具有确定性键和 BM25 搜索的优化 ArangoDB
    • 添加了用于知识图训练的 GNN 预处理脚本