基于语义扩展的微博突发事件检测技术
成果类型:: 实用新型专利
发布时间: 2022-12-05 16:56:10
现有技术中的微博事件检测的方法可以分为两类,一类是针对特定事件的微博事件检测方法,一类是通用的微博事件检测方法。对于特定事件的微博事件检测方法,通常需要对事件一定的先验知识,比如针对地震事件,通过地震相关的关键词找出相关微博,对这部分微博进行分析,但是对于突发事件很难具有先验的信息,因此,该种微博事件检测方法具有很强的局限性。对于通用的微博事件检测方法不需要事件的先验知识,主要包括基于突发特征检测、主题模型、聚类或者图的方法,但是这些方法普遍需要离线检测,不能处理流式数据。本成果提供一种基于语义扩展的微博突发事件检测技术,以解决上述问题。
本成果提供的基于语义扩展的微博突发事件检测技术包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度。本技术的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测。
微博的社会化特性及其可以被迅速、及时的传播,吸引了大量对信息实时性有高需求的网民。尤其是在突发事件的信息传播上,微博更是超越了传统媒体,成为了信息快速传播的渠道。微博上的信息不仅发布及时,而且也是现实社会生活的缩影,挖掘微博上的信息有利于从不同角度分析现实世界的情况。因此,从海量的微博数据检测事件具有十分重要的意义。
来自北京航空航天大学,可为本项目的研究开展提供良好的研究工作条件。项目的研究团队由教授、青年教师、博士生和硕士生等人员组成,团队负责人多年从事相关方面的科研与教学工作,负责完成过科技重大专项课题等以及横向合作等多项课题的研究工作。团队人员构成合理,技术基础好,研发能力强,为本项目的研究开展提供了良好的人员保障
微博的社会化特性及其可以被迅速、及时的传播,吸引了大量对信息实时性有高需求的网民。尤其是在突发事件的信息传播上,微博更是超越了传统媒体,成为了信息快速传播的渠道。微博上的信息不仅发布及时,而且也是现实社会生活的缩影,挖掘微博上的信息有利于从不同角度分析现实世界的情况。因此,从海量的微博数据检测事件具有十分重要的意义。
目前处于何种研发阶段: ☒研发 ☐小试 ☐中试 ☐小批量生产 ☐产业化; 样机: ☒ 有 ☐无 其他:□如选择“其他”,请说明:。
已投入成本: 200000 元。
推广应用情况:已用于学术研究。转化方式:转化方式:合作开发、技术转让、技术许可、技术参股、采购合同、买卖合同