大约10年前,业务呈指数级扩展,因此数据也在迅速增长。 其中许多自然可以被建模为图,图计算的需求在许多领域中出现, 例如
图遍历 - 访问图中节点的过程 - 是许多在线和交互式图应用程序中的关键原语,例如,
Gremlin 是事实上的标准语言,允许对各种图操作进行高级和声明式编程。
循环检测:用于在图中发现一个循环,即路径回环到起始顶点。
g.V().has('name','tom').as('a').repeat(out().simplePath()) .times(LENGTH).where(out().as('a')).path()
Gremlin
查询编译如循环检测示例所示,Gremlin查询可以是迭代和嵌套操作的任意组合。
g.V().has('firstname','Tom').as('a') .repeat(out().simplePath()).times(k) .where(out().eq('a')).path()
实体解析:识别并链接同一现实世界实体的不同表示。这并非易事,面临的挑战有:
我们曾经在一个内部的以顶点为中心的图系统ODPSGraph上工作,以并行化实体解析。然而,多年来出现了越来越多的挑战。
我们在SIGMOD'2017上介绍了PIE和GRAPE,并在 https://github.com/alibaba/libgrape-lite 开源了它。
给定一个查询 Q 和一个图 G,要计算 Q(G),用户只需要提供 3 个函数。
SIGMOD'2017
最佳论文奖
VLDB'2017
最佳演示奖
SIGMOD'2018
研究亮点
基于GNN的推荐
在VLDB'2019上展示,并在
https://github.com/alibaba/graph-learn
开源。它已经在阿里巴巴内外的许多场景中成功应用。
专门的图形应用程序也被广泛采用。我们列出了我们的一些研究...
VLDB'2020
最佳论文(亚军)
电子商务平台中欺诈检测的简化工作流程:
我们在VLDB'2021上展示了GraphScope,并在
https://github.com/alibaba/graphscope
pip install graphscope
兼容的图操作和算法API与NetworkX
我们在SIGMOD'2023上介绍了Vineyard,并在
https://github.com/v6d-io/v6d上开源了它,Vineyard是一个CNCF沙盒项目。
为什么我们需要 vineyard?
Vineyard 提供:
该图展示了现实世界中图系统的简化视图。它具有以下特点
即使是单个数据集也可以根据其特定需求以不同的方式进行建模。
用于图形查询
用于图分析
用于图学习
图存储可以多种多样。计算引擎访问数据的要求也各不相同。
开源在 https://github.com/graphscope/GRIN
GRIN 是 GraphScope 中提出的标准图检索接口。其目标是简化不同计算引擎和存储引擎之间的集成,从 M * N 减少到 M + N。
作为Apache孵化项目开源
https://github.com/apache/GraphAr
GraphAr(“Graph Archive”的缩写)是一个旨在使各种应用和系统(内存和外部存储、数据库、图计算系统以及交互式图查询框架)更方便和高效地构建和访问图数据的项目。
问题: 通过检查每个订单与已知欺诈行为的对比,识别电子商务中的可疑交易。
这个问题可以通过部署GraphScope Flex与这些组件来解决。
问题: 识别负责引导公司的主要股东,即持有超过51%股份的股东。
这个问题由GraphScope Flex分析堆栈解决,其实现了一个基于标签传播的分析算法。
欢迎加入我们的团队!
参考文献
版权