您所在的位置: 成果库 一种大数据智能搜索方法

一种大数据智能搜索方法

发布时间: 2022-12-13

来源: 科技服务团

基本信息

合作方式: 技术转让
成果类型: 发明专利
行业领域:
电子信息技术,计算机及网络技术
成果介绍
本发明公开了一种大数据智能搜索方法,包括以下步骤:对用户输入的搜索词进行补缺和去重;对预处理后的搜索词进行特征工程构建;对预处理后的搜索词进行语义分析和语义扩展;收集用户历史搜索行为记录,分析出用户历史搜索行为记录中搜索词中关键语义词的占比;对上述步骤的内容进行综合判定,根据判定结果显示最优搜索结果进行显示;本发明通过对用户输入的搜索词进行补缺和去重,通过对搜索词进行语义分析和语义扩展,能够有效提高搜索词的完整性,有利于搜索引擎更加精确获得搜索词的语义信息,能有效提高大数据搜索速度和质量,语义扩展能够提高大数据搜索的一次性命中率,能够节约用户的搜索时间。
成果亮点
.一种大数据智能搜索方法,其特征在于,包括以下步骤: 步骤一:对用户输入的搜索词进行预处理,包括对搜索词进行补缺和去重; 步骤二:对预处理后的搜索词进行特征工程构建,提取各类单标签数据集特征; 步骤三:对预处理后的搜索词进行语义分析和语义扩展,得到扩展搜索词; 步骤四:在搜索引擎内收集用户历史搜索行为记录,并对用户历史搜索行为记录进行分析,分析出用户历史搜索行为记录中搜索词中关键语义词的占比; 步骤五:对预处理后的搜索词、单标签数据集特征、扩展搜索词和用户历史搜索行为记录中搜索词中关键语义词的占比进行综合判定,根据判定结果显示最优搜索结果进行显示。 2.根据权利要求1所述的一种大数据智能搜索方法,其特征在于:所述步骤一中对搜索词进行补缺具体为:对搜索词中数值型属性的缺失值使用中位数填充;对搜索词中非数值型属性的缺失值使用众数填充。
团队介绍
雷锋团队是由哈尔滨师范大学14级政治与行政学院的关明贺同学于2015年9月1日建立的学生自主创立的创业团队。在黑龙江福成科技有限公司的赞助下,旨在为江北的大学生服务,让大学生过上更好的大学生活。自创立以来,雷锋团队本着为同学服务的宗旨,解决大学生生活问题为核心,为大学生提供广大的创业机会。创立后不久已成为哈尔滨江北十余所大学院校人数最多、最有号召力和影响力的学生团队组织。
成果资料
产业化落地方案
点击查看
成果综合评价报告

评价单位:“科创中国”黑龙江科技服务团 (黑龙江省科学技术协会) 评价时间:2023-11-11

张展

容错与移动计算研究中心

计算机系副主任

综合评价

技术前景广阔,具备技术成果转移转化要求。
查看更多>

评价单位:“科创中国”黑龙江科技服务团 (黑龙江省科学技术协会) 评价时间:2022-12-27

黄剑华

哈尔滨工业大学

教授

综合评价

通过对用户输入的搜索词进行补缺和去重,通过对搜索词进行语义分析和语义扩展,能够有效提高搜索词的完整性,有利于搜索引擎更加精确获得搜索词的语义信息,能有效提高大数据搜索速度和质量,语义扩展能够提高大数据搜索的一次性命中率,能够节约用户的搜索时间。
查看更多>
更多