一种中文钓鱼网站检测方法及系统
成果类型:: 发明专利
发布时间: 2023-06-28 10:22:18
2013年手机在线支付增长迅猛,用户数达到1.25亿,交易规模突破1.2万亿元。但 与此同时,手机支付面临的风险因素也快速增长了 312%,成为威胁网民资产非常重要的原 因,网络钓鱼已经成为最严重的一种网络犯罪形式。所谓“钓鱼网站”,是指不法分子利用各 种手段,仿冒真实网站的地址以及页面内容,或者利用真实网站服务器程序上的漏洞在站 点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资 料。目前,用户在手机端上网过程中面临的钓鱼攻击危害程度已超过PC端。比PC具有更强的 诱惑性,隐蔽性和误导性。钓鱼式攻击严重影响网络银行、电子支付网站的发展。危害用户 利益的同时又影响被仿造网站的信誉,阻碍移动互联网的发展。手机上网的用户由于受手 机界面的限制,比电脑上网更难区分网站真假。一旦上当,将个人信息提交到钓鱼网站,很 难避免经济损失。
提取网址URL特征和网站页面内容特征作为特征向量,可以提高分类的精度;
[0051] 使用TF-IDF算法对网站页面内容特征向量进行筛选,可以提高分类的效率;
[0052] 使用SVM支持向量机、NBC朴素贝叶斯算法、决策树算法和链接表单的相应处理进 行对应的分类训练,分类效率显著提高;
[0053] 使用分类集成对预测结果进行集成得到最终结果,大大的提高了分类的精度。
技术合作
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在 不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0151] 此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包 含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当 将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员 可以理解的其他实施方式。