大约十年前,业务呈指数级扩张,数据也随之迅猛增长。 其中许多数据天然适合建模为图结构,因此图计算的需求在多个领域涌现,例如
图遍历——访问图中节点的过程——是许多在线和交互式图应用中的关键基础操作,例如,
Gremlin 是事实上的标准语言,它允许通过高级声明式编程来实现各种图操作。
环检测:用于发现图中存在的环,即一条路径回绕到起始顶点形成闭环。
g.V().has('name','tom').as('a').repeat(out().simplePath())
.times(LENGTH).where(out().as('a')).path()
Gremlin 查询编译如循环检测示例所示,Gremlin查询可以任意组合迭代和嵌套操作。
g.V().has('firstname','Tom').as('a')
.repeat(out().simplePath()).times(k)
.where(out().eq('a')).path()
实体解析:识别并关联现实世界中同一实体的不同表示形式。这一任务并非易事,面临的挑战包括:
我们过去使用内部开发的顶点中心图系统ODPSGraph来实现实体解析的并行化。然而,多年来面临的挑战与日俱增。
我们在SIGMOD'2017上展示了PIE和GRAPE,并将其开源发布于 https://github.com/alibaba/libgrape-lite
给定查询Q和图G,要计算Q(G),用户只需提供3个函数。
SIGMOD'2017
最佳论文奖
VLDB'2017
最佳演示奖
SIGMOD'2018
研究亮点
基于GNN的推荐系统
在VLDB'2019会议上展示,并开源发布于
https://github.com/alibaba/graph-learn
该工具已在阿里巴巴内外的众多场景中成功应用。
专用图应用也被广泛采用。我们列举了一些我们的研究...
VLDB'2020
最佳论文(亚军)
电商平台欺诈检测的简化工作流程:
我们在VLDB'2021大会上发布了GraphScope,并开源在
https://github.com/alibaba/graphscope
pip install graphscope
兼容NetworkX的图操作和算法API
我们在SIGMOD'2023上展示了Vineyard,并在
https://github.com/v6d-io/v6d开源了该项目,Vineyard是CNCF沙箱项目。
为什么我们需要vineyard?
Vineyard提供:
该图展示了现实世界中图系统的简化视图。它具有以下特点
即使是同一个数据集,也可以根据具体需求以不同方式进行建模。
用于图查询
用于图分析
用于图学习
图存储可以多种多样。计算引擎访问数据的需求也各不相同。
开源地址: https://github.com/graphscope/GRIN
GRIN是GraphScope中提出的标准图检索接口。其目标是将不同计算引擎与存储引擎之间的集成复杂度从M*N降低到M+N。
作为Apache孵化项目开源
https://github.com/apache/GraphAr
GraphAr(全称“Graph Archive”)是一个旨在让各类应用和系统(包括内存与外部存储、数据库、图计算系统以及交互式图查询框架)能更便捷高效地构建和访问图数据的项目。
问题:通过将每笔订单与已知欺诈行为进行比对,识别电子商务中的可疑交易。
这个问题可以通过部署GraphScope Flex并使用这些组件来解决。
问题:识别负责掌控公司的主导股东,即持股超过51%的股东。
这一问题由GraphScope Flex分析堆栈解决,其实现了一种基于标签传播的分析算法。
欢迎加入我们,携手合作!
参考文献
版权