面向知识图谱应用的图数据库系统gStore
成果类型:: 发明专利
发布时间: 2022-10-20 10:05:32
gStore是由北京大学王选所数据管理实验室历经十年研发面向RDF知识图谱的开源图数据库系统(通常称为Triple Store)。不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph Model),维持了原始RDF知识图谱的图结构;其数据模型是有标签、有向的多边图,每个顶点对应着一个主体或客体。我们将面向RDF的SPARQL查询,转换为面向RDF图的子图匹配查询,同时利用我们所提出的基于图结构的索引(VS-tree)来加速查询的性能。这种创新性的方式,由我们在2011年发表在数据库领域顶级会议VLDB上;同时方法首创性得到了国内外学术同行,包括IBM的资深研究员,ACM Fellow等在其发表论文中的明确肯定。围绕着构建图数据库系统gStore的核心引擎,我们研究了图数据库的分布式部署与优化、动态图数据管理、图数据库事务、知识图谱数据的智能检索等,发表50余篇数据库领域顶级期刊和会议论文(CCF-A)。产品:研发 gStore 的同时,我们围绕图数据库的相关特性研发出了与之配套的相关产品,具体有开箱即用的gStore云平台--gCloud、分布式图数据库--gMaster、gStore可视化管理工具--gStore Workbench以及软硬件一体机。服务:在北京大学大数据分析与应用国家工程实验室的支持下,目前本团队在北京和重庆均有研发和应用开发工程师,立足于北京、重庆两地辐射全国,快速响应客户需求和售后,并提供7*24小时在线咨询和技术支撑。
行业历史:图数据库的发展主要是解决关系网络数据的存储,查询和分析问题,能支持上层应用对关系网络数据的OLTP业务需求以及离线大规模图数据的OLAP业务需求。据DB-Engines数据显示,最近十年,图数据库已经成为关注度最高、也是发展趋势最明显的数据库类型。前景分析与预测:随着近几年的快速发展,基于图数据库的应用如知识图谱、风险防控、智能物联网在金融、电信、公共安全、医疗等行业快速落地,并形成了较好的应用效果。此外当前国家政策在人工智能和大数据方面有大力支撑,政策形式向好。图数据库具有良好的市场空间和前景, 2020年中国数据库市场规模达240.9亿元,未来将继续保持增长,预计到2025年全球数据库市场规模将达到798亿美元,中国数据库市场规模将达到688.02亿元,市场年复合增长率(CAGR)为23.4%,其中图数据库在数据库领域又是增长速率最快的数据库种类。此外 2019 年,Gartner在数据与分析峰会上首次将图数据库列为 2019 年十大数据和分析趋势之一,市场处于一片蓝海。产品为图数据库领域,但其应用在多个行业和领域,其它行业和领域的发展也将带动图数据库的进一步发展和扩展图数据库市场规模。预计到 2022 年,全球图处理及图数据的应用将以每年 100% 的速度迅猛增长,2020 年保守估计为 80 亿美元,预计图数据库2025全球市场规模保守估计在100亿美元,中国图数据库市场规模将达到百亿规模。
技术合作