您所在的位置: 成果库 一种基于概念图的跨语言信息检索方

一种基于概念图的跨语言信息检索方

发布时间: 2023-09-22

来源: 科技服务团

基本信息

合作方式: 技术许可
成果类型: 发明专利
行业领域:
高技术服务业
成果介绍
本发明公开了一种基于概念图的跨语言信息检索方法,所述基于概念图的跨语言信息检索方法为跨语言相似度评估框架CG‑CLIR的方法,包括以下步骤:S1,基于Skip‑Gram的概念图边表示;S2,融合边信息的高阶语义嵌入及相似度计算;所述步骤S1包括文本预处理、概念图边语义嵌入;所述步骤S2包括基于LSTM的图级别语义嵌入、基于图嵌入的相似度计算。本发明的方法在文本跨语言信息检索中,跨越了语言障碍,在不经过翻译的情况下,实现了语义检索的效果。
成果亮点
使用递归神经网络模型适应节点属性和邻域信息以及从随机游走方法采样的节点序列,每个元素 在节点序列中,对应于所有图节点上的softmax,表示为 的输入节点特征和表示为 的邻域特征被计算为对应节点和相邻嵌入的加权和: 其中ei是由第一阶段算法生成的节点的表示,并且 作为节点i的聚合邻域嵌入;给定由 定义的循环单元的状态,将状态更新修改为 以考虑节点和邻域信息;图层级表示形成为所有序列步骤上的隐藏单元的总和
团队介绍
大数据国家工程研究中心累计投资3亿余元条件建设和科研运行经费,完成科研条件建设,组建了一支330余人的科研团队,其中,专业技术人员271人,博士46人,硕士研究生142人,正高级职称23人,高级工程师55人。同时聘请了陈润生、沈昌祥、王陇德、杨小牛、岳清瑞、王坚等6位院士担任领军专家。
成果资料
成果综合评价报告

评价单位:“科创中国”贵州科技服务团 (贵州省科学技术协会) 评价时间:2023-11-05

丁红发

贵州财经大学

副教授

综合评价

经讨论,专家组评价该成果为跨语言信息检索,具体涉及一种基于概念图的跨语言信息检索方法,由于传统的搜索方案如Sentence2Vec、Doc2vec等传统的检索方法往往通过浅层的文本特征信息进行相似度评价,即使利用语义进行相似度对比,也往往仅仅体现在词层面,对于全局语音特征的利用不够充分。本方法的技术优势在于跨语言相似度评估框架CG-CLIR的方法,能够跨越语言障碍,在不经过翻译的情况下,实现了语义检索的效果。 该方法适用于各个行业和领域,特别是搜索引擎、大数据分析和知识图谱等领域。在搜索引擎领域,该方法可以提供跨语言的语义搜索服务,改善用户的搜索体验。在大数据分析领域,该方法可以帮助分析师跨越语言障碍,获取到全球范围内的相关数据。在知识图谱领域,该方法可以实现语义链接和知识检索,提升知识图谱的可用性和价值。 专家建议:一是寻求合作:与搜索引擎提供商、语义分析公司等建立合作关系,共同推动该技术的应用和推广。通过合作共建,可以获得更多资源和支持,提高市场竞争力;二是寻求投资:寻找投资机构或风险投资者,向其展示该技术的市场价值和商业潜力。获得资金支持可以加速技术的落地和推广;三是加强研发:持续改进和优化该技术,提高概念图的准确嵌入表示和匹配算法。同时,加强对不同领域和语言的适应性研究,提高技术的可靠性和通用性。
查看更多>
更多