成果介绍
现有技术中的微博事件检测的方法可以分为两类,一类是针对特定事件的微博事件检测方法,一类是通用的微博事件检测方法。对于特定事件的微博事件检测方法,通常需要对事件一定的先验知识,比如针对地震事件,通过地震相关的关键词找出相关微博,对这部分微博进行分析,但是对于突发事件很难具有先验的信息,因此,该种微博事件检测方法具有很强的局限性。对于通用的微博事件检测方法不需要事件的先验知识,主要包括基于突发特征检测、主题模型、聚类或者图的方法,但是这些方法普遍需要离线检测,不能处理流式数据。本成果提供一种基于语义扩展的微博突发事件检测技术,以解决上述问题。
成果亮点
本成果提供的基于语义扩展的微博突发事件检测技术包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度。本技术的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测。
团队介绍
来自北京航空航天大学,可为本项目的研究开展提供良好的研究工作条件。项目的研究团队由教授、青年教师、博士生和硕士生等人员组成,团队负责人多年从事相关方面的科研与教学工作,负责完成过科技重大专项课题等以及横向合作等多项课题的研究工作。团队人员构成合理,技术基础好,研发能力强,为本项目的研究开展提供了良好的人员保障。
成果资料
产业化落地方案