您所在的位置: 成果库 面向知识图谱应用的图数据库系统gStore

面向知识图谱应用的图数据库系统gStore

成果类型:: 发明专利

发布时间: 2022-10-20 10:05:32

科技成果产业化落地方案
方案提交机构:“科创中国”工业互联网产业科技服务团| 马宇星 | 2022-11-09 16:30:37
gStore图数据库系统定位为知识图谱和图分析的行业应用提供底层数据管理的基础软件系统。该系统由北大邹磊教授团队历经十年研发,具有国际影响力的学术理论创新,底层数据结构、索引再到核心系统的研发均为自主设计,并经历十余个版本迭代形成了完善、成熟的开发体系和软件产品体系。同时围绕图数据库系统的核心系统研发,围绕gStore的前期理论成果获得2017年教育部自然科学二等奖(“大规模图结构数据管理”)。
对于大数据中关联关系的处理,图数据库的处理性能远超其他类型数据库,被广泛应用于金融、工业、政务、零售、电信和生命科学等各学科和工业领域。当前国内外图数据库已有10余款,主要集中在新兴初创公司、大型互联网企业、高校实验室及研究所中。图数据库在大数据时代各行业需求迫切,但行业内尚无领导性图数据库企业,仍处于百花齐放阶段。图数据库行业与人工智能和大数据行业关联性极强,人工智能和大数据行业的发展会大力推动图数据库行业的发展。

gStore是由北京大学王选所数据管理实验室历经十年研发面向RDF知识图谱的开源图数据库系统(通常称为Triple Store)。不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph Model),维持了原始RDF知识图谱的图结构;其数据模型是有标签、有向的多边图,每个顶点对应着一个主体或客体。我们将面向RDF的SPARQL查询,转换为面向RDF图的子图匹配查询,同时利用我们所提出的基于图结构的索引(VS-tree)来加速查询的性能。这种创新性的方式,由我们在2011年发表在数据库领域顶级会议VLDB上;同时方法首创性得到了国内外学术同行,包括IBM的资深研究员,ACM Fellow等在其发表论文中的明确肯定。围绕着构建图数据库系统gStore的核心引擎,我们研究了图数据库的分布式部署与优化、动态图数据管理、图数据库事务、知识图谱数据的智能检索等,发表50余篇数据库领域顶级期刊和会议论文(CCF-A)。产品:研发 gStore 的同时,我们围绕图数据库的相关特性研发出了与之配套的相关产品,具体有开箱即用的gStore云平台--gCloud、分布式图数据库--gMaster、gStore可视化管理工具--gStore Workbench以及软硬件一体机。服务:在北京大学大数据分析与应用国家工程实验室的支持下,目前本团队在北京和重庆均有研发和应用开发工程师,立足于北京、重庆两地辐射全国,快速响应客户需求和售后,并提供7*24小时在线咨询和技术支撑。

北京大学邹博士团队致力于大数据时代,目前团队研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理。包括已经发表了50余篇数据库领域顶级国内外学术论文;其中邹博士承担了包括国家自然基金、国家重点研发项目等多项国家科研攻关项目;其研究也到了包括华为、微软、腾讯、阿里、蚂蚁金服和方正电子等产业界公司的资助。

行业历史:图数据库的发展主要是解决关系网络数据的存储,查询和分析问题,能支持上层应用对关系网络数据的OLTP业务需求以及离线大规模图数据的OLAP业务需求。据DB-Engines数据显示,最近十年,图数据库已经成为关注度最高、也是发展趋势最明显的数据库类型。前景分析与预测:随着近几年的快速发展,基于图数据库的应用如知识图谱、风险防控、智能物联网在金融、电信、公共安全、医疗等行业快速落地,并形成了较好的应用效果。此外当前国家政策在人工智能和大数据方面有大力支撑,政策形式向好。图数据库具有良好的市场空间和前景, 2020年中国数据库市场规模达240.9亿元,未来将继续保持增长,预计到2025年全球数据库市场规模将达到798亿美元,中国数据库市场规模将达到688.02亿元,市场年复合增长率(CAGR)为23.4%,其中图数据库在数据库领域又是增长速率最快的数据库种类。此外 2019 年,Gartner在数据与分析峰会上首次将图数据库列为 2019 年十大数据和分析趋势之一,市场处于一片蓝海。产品为图数据库领域,但其应用在多个行业和领域,其它行业和领域的发展也将带动图数据库的进一步发展和扩展图数据库市场规模。预计到 2022 年,全球图处理及图数据的应用将以每年 100% 的速度迅猛增长,2020 年保守估计为 80 亿美元,预计图数据库2025全球市场规模保守估计在100亿美元,中国图数据库市场规模将达到百亿规模。

技术合作