您所在的位置: 成果库 一种短文本间语义距离的计算机辅助计算方法

一种短文本间语义距离的计算机辅助计算方法

发布时间: 2022-11-28

来源: 科技服务团

基本信息

合作方式: 技术许可
成果类型: 发明专利
行业领域:
电子信息技术
成果介绍
本成果应用于短信、微博、论坛评论和新闻评论等应用所产生的文本进行分析研究,对于政府及企业都具有重要意义,分析研究在线评论成为分析网络舆情的重要方面,引起政府、学术界和产业界的高度重视。本成果属于文字信息处理领域,其特征在于把两个短文本间的语义距离定义为句法结构距离和单元语义距离之和进行计算,克服了现有技术的局限性
成果亮点
本成果的目的在于针对网络上的短文本,提出一种短文本语义距离计算方法与系统。本发明综合考虑短文本间在句法结构和单元语义两方面上的差别程度,提出了一种综合的语义距离计算方法,克服了传统方法在短文本距离计算或基于单元语义的计算方法、基于编辑距离的计算方法等。基于单元语义的计算方法仅考虑文本的词语而忽略其组织结构,或基于编辑距离的方法只考虑结构,而忽略词语的意义,并且对于不同长度的文本计算存在较大误差的局限性。
团队介绍
北京工业大学是一所以工为主,工、理、经、管、文、法、艺术、教育相结合的多科性市属重点大学。8个学科跻身2020年QS世界大学排行榜前500,位列QS2020年世界大学排名中国内地第32,工程学、材料科学、化学、环境科学与生态学、计算机科学、生物学与生物化学6个学科进入ESI前1%。 该成果的第一发明人杨震博士长期从事机器学习、数据挖掘、社会计算、可信计算等领域的研究,先后主持北京工业大学校青基金项目 、北京市自然科学基金面上项目、国家自然科学基金青年基金项目。2021年11月,拟入选2021年度青海省“昆仑英才·高端创新创业人才”计划名单。
成果资料
产业化落地方案
点击查看