本发明公开了一种大数据智能搜索方法,包括以下步骤:对用户输入的搜索词进行补缺和去重;对预处理后的搜索词进行特征工程构建;对预处理后的搜索词进行语义分析和语义扩展;收集用户历史搜索行为记录,分析出用户历史搜索行为记录中搜索词中关键语义词的占比;对上述步骤的内容进行综合判定,根据判定结果显示最优搜索结果进行显示;本发明通过对用户输入的搜索词进行补缺和去重,通过对搜索词进行语义分析和语义扩展,能够有效提高搜索词的完整性,有利于搜索引擎更加精确获得搜索词的语义信息,能有效提高大数据搜索速度和质量,语义扩展能够提高大数据搜索的一次性命中率,能够节约用户的搜索时间。
.一种大数据智能搜索方法,其特征在于,包括以下步骤:
步骤一:对用户输入的搜索词进行预处理,包括对搜索词进行补缺和去重;
步骤二:对预处理后的搜索词进行特征工程构建,提取各类单标签数据集特征;
步骤三:对预处理后的搜索词进行语义分析和语义扩展,得到扩展搜索词;
步骤四:在搜索引擎内收集用户历史搜索行为记录,并对用户历史搜索行为记录进行分析,分析出用户历史搜索行为记录中搜索词中关键语义词的占比;
步骤五:对预处理后的搜索词、单标签数据集特征、扩展搜索词和用户历史搜索行为记录中搜索词中关键语义词的占比进行综合判定,根据判定结果显示最优搜索结果进行显示。
2.根据权利要求1所述的一种大数据智能搜索方法,其特征在于:所述步骤一中对搜索词进行补缺具体为:对搜索词中数值型属性的缺失值使用中位数填充;对搜索词中非数值型属性的缺失值使用众数填充。
雷锋团队是由哈尔滨师范大学14级政治与行政学院的关明贺同学于2015年9月1日建立的学生自主创立的创业团队。在黑龙江福成科技有限公司的赞助下,旨在为江北的大学生服务,让大学生过上更好的大学生活。自创立以来,雷锋团队本着为同学服务的宗旨,解决大学生生活问题为核心,为大学生提供广大的创业机会。创立后不久已成为哈尔滨江北十余所大学院校人数最多、最有号召力和影响力的学生团队组织。
评价单位:“科创中国”黑龙江科技服务团 (黑龙江省科学技术协会)
评价时间:2023-11-11
综合评价
技术前景广阔,具备技术成果转移转化要求。
查看更多>
评价单位:“科创中国”黑龙江科技服务团 (黑龙江省科学技术协会)
评价时间:2022-12-27
综合评价
通过对用户输入的搜索词进行补缺和去重,通过对搜索词进行语义分析和语义扩展,能够有效提高搜索词的完整性,有利于搜索引擎更加精确获得搜索词的语义信息,能有效提高大数据搜索速度和质量,语义扩展能够提高大数据搜索的一次性命中率,能够节约用户的搜索时间。
查看更多>