成果介绍
本发明适用于信息技术领域,提供了一种垃圾短信的识别方法及装置,包括:对接收到的短信进行分词处理,得到N个分词词组,所述N为大于1的整数;根据所述短信的分词词组在预设的垃圾短信词库中的匹配结果,计算所述短信为垃圾短信的可能性指数;当所述短信的所述可能性指数大于预设阈值时,将所述短信识别为垃圾短信。在本发明中,将终端接收到的新短信进行分词处理,以将处理得到的分词词组在预设的垃圾短信词库中进行查找匹配,根据查找匹配的结果来识别该接收到的新短信是否为垃圾短信,由此实现了对垃圾短信的自动、智能识别,不再需要通过手动操作来进行垃圾短信识别,由此降低了对终端的资源消耗。
成果亮点
一种垃圾短信的识别方法,其特征在于,包括:根据预设的垃圾短信词库中的词组在垃圾短信中出现的词频,为每个所述词组赋予相应的权值;判断短信的发送号码是否存在于通讯录中;若所述短信的发送号码不存在于所述通讯录中,对接收到的所述短信进行分词处理,得到N个分词词组,所述N为大于1的整数;根据所述短信的分词词组在预设的垃圾短信词库中的匹配结果,计算所述短信为垃圾短信的可能性指数,包括,根据每个所述分词词组在所述预设的垃圾短信词库中匹配到的权值,计算所述短信的权值平均值;获取在所述预设的垃圾短信词库中匹配到权值的所述分词词组的数量占所述短信中所有分词词组数量的比例;根据所述短信的权值平均值与所述比例的乘积,计算所述短信为垃圾短信的可能性指数;当所述短信的所述可能性指数大于预设阈值时,将所述短信识别为垃圾短信。
团队介绍
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
成果资料
产业化落地方案