安装指南 - 扩展版#

本扩展指南提供了安装PyGraphistry的详细说明,包括增强性能和功能的可选配置。

GPU 模式系统要求(可选)#

  • Nvidia RAPIDS: PyGraphistry 主要与 Nvidia RAPIDS 对齐,因此请检查您的系统是否符合他们的要求:

    • Volta 代 GPU 或更新版本 是当前 Nvidia RAPIDS 的最低要求。

    • cuDF: 必需。

    • cuML, cuGraph: 推荐。

  • PyTorch: PyGraphistry[AI] 进一步与 PyTorch 对齐,以支持其一些更高级的方法。

核心依赖项(默认安装)#

PyGraphistry 依赖于一小部分标准的基于CPU的Python数据科学库,如pandas、pyarrow和numpy。如果您的系统缺少这些依赖项,它们将自动安装。

可选依赖项#

PyGraphistry 支持多种可选依赖项以扩展其功能。

使用RAPIDS进行GPU加速#

要为DataFrames和图分析启用GPU加速,请从NVIDIA RAPIDS套件中安装cuDFcuMLcuGraph

按照NVIDIA RAPIDS 安装指南中的说明进行操作。

额外的可选依赖项#

以下许多内容可以在CPU模式和GPU模式下使用。

  • AI库:

    • torch (1GB+): PyTorch 及相关库,用于 PyGraphistry AI 包中的高级 AI 方法。

      安装方法:

      pip install graphistry[ai]
      
  • 图形库:

    • networkx: 与NetworkX图表的集成。

      安装方法:

      pip install graphistry[networkx]
      
    • igraph: 支持 igraph 图。

      安装方法:

      pip install graphistry[igraph]
      
    • pygraphviz: 使用Graphviz布局渲染图形。

      安装方法:

      pip install graphistry[pygraphviz]
      
  • 图数据库和协议:

    • gremlinpython: 使用Gremlin图数据库。

      安装方法:

      pip install graphistry[gremlin]
      
    • neo4j, neotime: 通过Bolt协议连接到Neo4j。

      安装方法:

      pip install graphistry[bolt]
      
  • 数据格式:

    • openpyxl, xlrd: 读取NodeXL文件。

      安装方法:

      pip install graphistry[nodexl]
      
  • 机器学习与人工智能:

    • umap-learn, dirty-cat, scikit-learn: 用于降维和聚类。

      安装方法:

      pip install graphistry[umap-learn]
      
    • scipy, dgl, torch<2, sentence-transformers, faiss-cpu, joblib: 高级人工智能功能。

      安装方法:

      pip install graphistry[ai]
      
  • Jupyter 支持:

    • ipython: 增强的Jupyter笔记本集成。

      安装方法:

      pip install graphistry[jupyter]
      

安装多个附加组件#

您可以通过列出多个附加组件并用逗号分隔来安装它们:

pip install graphistry[networkx,umap-learn]

安装所有可选依赖项#

安装所有可选的依赖项(由于大小和潜在的冲突,通常不推荐):

pip install graphistry[all]

常见问题#

我需要服务器吗?#

  • ,你可以在本地运行GFQL和其他PyGraphistry的CPU和GPU组件。要使用完整的可视化功能,你需要访问Graphistry服务器。

  • 选项:

我可以在没有GPU支持的情况下使用PyGraphistry吗?#

  • 是的,PyGraphistry 可以在没有 GPU 支持的情况下使用。

  • GPU加速:要利用GPU加速,请安装可选的GPU库,如cuDF,并确保拥有兼容的硬件。

安装可选依赖项的好处是什么?#

  • 增强功能:支持不同的图形格式、高级分析、机器学习以及与各种工具和数据库的集成。例如,对于需要仔细布局小树的可视化用户,我们推荐pygraphviz,而对于需要处理大量GFQL工作负载的用户,我们推荐RAPIDS。

  • 自定义: 仅安装您特定用例所需的内容。

如何安装开发依赖项?#

对于希望参与PyGraphistry本身的贡献者和开发者,我们推荐使用Docker,或者进行本地开发:

  • 安装方法

    pip install graphistry[dev]
    
  • 包括: 测试工具、文档工具和其他开发依赖项,如 flake8, pytest, sphinx 等。

参考文献#

祝您绘图愉快!