生活服务知识图谱构建关键技术及应用
成果类型:: 发明专利,软件著作权,著作权
发布时间: 2022-11-12 18:45:17
知识图谱的构建分为知识存储、知识挖掘、以及知识应用三个层次。在知识存储方面,基于Nebula Graph内核自研的图数据库架构支持千亿顶点、万亿边超大规模图的存储与维护,可完成千亿边级别大图的毫秒级查询。目前图数据库承接了美团内61个需求,共存储了约16TB的图数据;在知识挖掘方面,依托美团在生活服务领域业务上积累的海量用户、商户、商品数据,通过信息抽取、关系挖掘、打标等算法能力构建了高质量、高覆盖的生活服务知识库,序列标注技术和评论信息抽取技术在内部和公开数据集上达到业界先进水平;在知识应用上,重点发力基于知识图谱的问答技术(KBQA)以及相关的表单问答技术Text2SQL,在公司内支撑了酒店问一问,优选极光、美团管家等产品中的信息查询需求,在外部获得了CCKS KBQA比赛唯一的技术创新奖,在Yale和Salesforce联合发布的Text2SQL榜单Spider上位列第一。
1.提出了基于图神经网络的知识增强序列标注方法,提升了短文本概念抽取的性能;提出了基于阅读理解模型的概念挖掘方法,提升了长文本概念抽取的性能。2.提出了基于生成与验证框架的类目体系自动构建方法,提高了构建知识图谱的效率;提出了时空图表征学习方法,提升了商户推荐的效果。3.提出了关系抽取、关系匹配、关系推理的预训练方法,使知识问答系统的准确率达到了94%。
美团搜索在美团App应用,利用知识图谱通过查询理解、供给召回、供给排序、结果可解释性等方式大幅提升搜索体验。具体包括:①图片筛选器,通过图谱下位关系扩展查询,细化用户意图,提高搜索效率。②查询理解,通过图谱上下位、同义关系对查询进行改写,更好地理解搜索意图。③标签召回,针对美团搜索中的泛场景模糊搜索的需求,通过图谱的标签及商户关系为搜索提供结构化召回,提升搜索丰富度。④可解释性,图谱通过标签、推荐理由等方式为用户提供决策信息。⑤排序特征,图谱的节点字段或节点向量表示作为特征加入排序模型中,提升搜索结果相关性。 美团推荐应用场景包括App首页、美食列表、团好货、快驴等业务推荐。本地生活业务具有很强位置和场景属性,项目通过知识图谱对场景理解并将知识融入到推荐模型中,让推荐更加智能化、可解释。具体包括:①在召回上,通过图谱中商户和用户的结构化知识,补充丰富、可解释召回结果,提升用户体验。②在排序上,利用图谱的结构化数据进行排序模型优化,提升结果相关性。③在推荐反馈上,通过供给的类目知识,更精准、可解释地过滤商品。
1 武威 男 1985年3月 无 博士 北京三快在线科技有限公司 项目负责人2 肖仰华 男 1980年9月 正高 博士 复旦大学 复旦合作项目负责人3 王思睿 男 1987年11月 无 硕士 北京三快在线科技有限公司 层次供需知识体系构建技术;知识图谱问答技术4 曹雪智 男 1991年8月 无 博士 北京三快在线科技有限公司 层次供需知识体系构建技术;基于知识增强的序列标注技术5 张梦迪 女 1991年7月 无 本科 北京三快在线科技有限公司 时空图表征学习技术;基于知识增强的序列标注技术6 谢睿 男 1988年1月 无 硕士 北京三快在线科技有限公司 低资源评论信息抽取技术7 梁家卿 男 1992年4月 副高 博士 复旦大学 层次供需知识体系构建技术8 刘井平 男 1991年11月 无 博士 复旦大学 层次供需知识体系构建技术
生活服务知识图谱项目积累的数据和技术通过在搜索和推荐两大场景的诸多任务中上线,累计带来了 137978 单的日均订单提升,按照每单 57.2 元的平均客单价来算,从 2020年到 2022 年 8 月 1 日,累计产生经济效益超过 29 亿元(H1 上线项目当年按半年收益计算,H2 上线项目来年按全年收益计算)。折合到近两年,2020 年产生经济效益超过 5 千 7 百万元,2021 年产生经济效益超过 14 亿元。表 1 给出了技术转化和收益的明细。需注意的是,知识图谱从 2018 年起即有技术转化,一些仅带来体验提升不能直接核算订单增长的转化未在表 1 中列出。除了通过提升订单量带来直接收入增长外,知识图谱应用于智能助理带来了人效方面的提升。目前酒店助理场景日均会话约 20 万,人工人均回复会话约 250 个/天,平均每天节省人力 800 人,一年 29 万人日/年
生活服务知识图谱项目于 2018 年 6 月启动,历经近 4 年迭代,目前已经在美团搜索、推荐、在线广告、智能客服等场景中落地,触达了美团 6.9 亿用户及900 万商户的同时,也带来了可观的经济效益。本项目计算经济效益的方法是统计 A/B 实验中使用知识图谱技术带来的订单增长。