PyGraphistry:利用图和GPU的力量来可视化、分析和扩展您的数据#

构建状态 CodeQL 文档状态 最新版本 最新版本 许可证 PyPI - 下载量

Uptime Robot 状态 Twitter 关注

Demo: Interactive visualization of 80,000+ Facebook friendships (source data)

PyGraphistry 是一个开源的 Python 库,供数据科学家和开发人员利用图可视化、分析和人工智能的强大功能,包括原生 GPU 加速:

从全球10大银行、制造商、新闻机构和政府机构,到初创公司、游戏公司、科学家、生物技术公司和非政府组织,许多团队都在使用Graphistry处理他们的图工作负载。

安装#

常见配置:

  • 最小核心

    包括:GFQL 数据帧原生图查询语言、内置布局、Graphistry 可视化服务器客户端

    pip install graphistry
    

    不包括 graphistry[ai], 插件

  • 无依赖和用户级别

    pip install --no-deps --user graphistry
    
  • GPU加速 - 可选

    本地GPU:安装RAPIDS和/或部署一个支持GPU的Graphistry服务器

    远程GPU:使用远程端点

有关更多选项,请参阅安装指南

可视化快速入门#

快速从原始数据到样式化和交互式的Graphistry图形可视化:

import graphistry
import pandas as pd

# Raw data as Pandas CPU dataframes, cuDF GPU dataframes, Spark, ...
df = pd.DataFrame({
    'src': ['Alice', 'Bob', 'Carol'],
    'dst': ['Bob', 'Carol', 'Alice'],
    'friendship': [0.3, 0.95, 0.8]
})

# Bind
g1 = graphistry.edges(df, 'src', 'dst')

# Override styling defaults
g1_styled = g1.encode_edge_color('friendship', ['blue', 'red'], as_continuous=True)

# Connect: Free GPU accounts and self-hosting @ graphistry.com/get-started
graphistry.register(api=3, username='your_username', password='your_password')

# Upload for GPU server visualization session
g1_styled.plot()

探索10 Minutes to Graphistry Visualization以获取更多可视化示例和选项

PyGraphistry[AI] 和 GFQL 快速入门 - CPU 和 GPU#

CPU 图形管道 结合了图形机器学习、人工智能、数据挖掘和可视化:

from graphistry import n, e, e_forward, e_reverse

# Graph analytics
g2 = g1.compute_igraph('pagerank')
assert 'pagerank' in g2._nodes.columns

# Graph ML/AI
g3 = g2.umap()
assert ('x' in g3._nodes.columns) and ('y' in g3._nodes.columns)

# Graph querying with GFQL
g4 = g3.chain([
    n(query='pagerank > 0.1'), e_forward(), n(query='pagerank > 0.1')
])
assert (g4._nodes.pagerank > 0.1).all()

# Upload for GPU server visualization session
g4.plot()

自动GPU模式几乎不需要代码更改:

import cudf
from graphistry import n, e, e_forward, e_reverse

# Modified -- Rebind data as a GPU dataframe and swap in a GPU plugin call
g1_gpu = g1.edges(cudf.from_pandas(df))
g2 = g1_gpu.compute_cugraph('pagerank')

# Unmodified -- Automatic GPU mode for all ML, AI, GFQL queries, & visualization APIs
g3 = g2.umap()
g4 = g3.chain([
    n(query='pagerank > 0.1'), e_forward(), n(query='pagerank > 0.1')
])
g4.plot()

探索10 Minutes to PyGraphistry以了解更多种类的图处理。

PyGraphistry 文档#

Graphistry生态系统#

社区和支持#

贡献#

请参阅CONTRIBUTINGDEVELOP以参与PyGraphistry的开发,或联系我们的团队

索引和表格#