一种暗链的检测方法及系统的制作方法
【技术领域】
[0001]本发明涉及网络安全领域,特别涉及一种暗链的检测方法及系统。
【背景技术】
[0002]随着互联网的快速发展和普及,互联网技术已向社会各个领域进行延伸,网站作为信息的载体向人们展示着丰富的内容。然而如何快速检索人们所感兴趣的内容,搜索引擎的出现解决了这个难题,搜索引擎会将信息搜集和整合后,按优先级将检索的结果依次展示给用户。
[0003]暗链是最有效的搜索引擎优化(SE0)作弊的方式之一,这也是黑客最常用的一种方式,通过批量入侵网站,然后在网页中植入暗链,来提高暗链在搜索引擎中的排名,从中牟取利益。
[0004]随着暗链与其检测技术的对抗,黑客在一些植入的暗链代码中会判断HTTP协议中的UserAgent信息是搜索引擎蜘蛛、还是浏览器访问,如果是浏览器访问,则隐藏暗链;传统采用人工检测暗链的方法,效率极低,而单纯依靠暗链的域名特征去检测,无法对隐藏暗链进行检测。
【发明内容】
[0005]针对上述现有技术中存在的问题,本发明提出了一种暗链的检测方法,解决了暗链检测的局限性,可以对隐藏的暗链进行检测,也解决了人工检测的滞后性问题。
[0006]一种暗链的检测方法,包括:
a.创建搜索引擎蜘蛛的用户代理信息库;
创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
b.逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
c.判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息,即暗链特征库中的特征;否则,执行步骤d ;
d.模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH;
e.判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链,返回步骤b ;否则所述网站存在隐藏暗链,执行步骤f ;
f.将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。
[0007]所述的方法中,所述步骤f,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0008]一种暗链的检测系统,包括:
建模模块:用于创建搜索引擎蜘蛛的用户代理信息库; 创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
检测模块,用于逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息;否则,模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH ;
判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链;否则所述网站存在隐藏暗链,进入处置模块;
处置模块,用于将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。
[0009]所述的系统中,所述处置模块,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0010]本发明的优势在于,提供了一种检测暗链的技术和实现,解决了目前检测暗链的局限性,对暗链基于特征码检测不全面的问题,可对隐藏的暗链进行检测;也解决了人工检测的滞后性问题,比传统检测方式效率更高。本发明基于用户代理模拟,同时采用内容匹配方式,不仅可以检测暗链,还可以恢复黑客植入的暗链,解决了传统检测暗链,只能查不能清除等特点。解决了对暗链处置清除的问题,无需人工参与处置问题。解决了传统特征码检测暗链需要人工参与,处置、添加规则是一个自闭合的过程。且本发明方法易于扩展、易于维护、可全自动运行,没有额外的开发及人工维护的开销,极大的方便了本发明方法的实现与运维。
[0011]本发明提出了一种暗链的检测方法及系统,通过建立搜索引擎蜘蛛用户代理信息库、暗链特征库和网站基本信息库,遍历网站基本信息库中的各网页,并将网页信息与暗链特征库进行对比,如果存在暗链特征库中的特征则所述的页面存在暗链,否则模拟搜索引擎蜘蛛用户代理信息,重新请求所述页面,并比较其HASH值与网站基本信息库中的HASH值是否相同,如果相同则所述页面不存在暗链,否则所述页面存在暗链。本发明的方法无需人为参与,即可对网站中的暗链进行检测并清除。极大提高了对暗链的检测效率。
【附图说明】
[0012]为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本发明一种暗链的检测方法实施例流程图;
图2为本发明一种暗链的检测系统实施例结构示意图。
【具体实施方式】
[0014]为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明。
[0015]针对上述现有技术中存在的问题,本发明提出了一种暗链的检测方法,解决了暗链检测的局限性,可以对隐藏的暗链进行检测,也解决了人工检测的滞后性问题。
[0016]一种暗链的检测方法,如图1所示,包括:
5101:创建搜索引擎蜘蛛的用户代理信息库;
创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
5102:逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
5103:判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息;否则,执行S104 ;
5104:模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH;
5105:判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链,返回S102 ;否则所述网站存在隐藏暗链,执行S106 ;
5106:将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。即两者不同处即为暗链。
[0017]所述的方法中,所述S106中,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0018]一种暗链的检测系统,如图2所示,包括:
建模模块201,用于创建搜索引擎蜘蛛
的用户代理信息库;
创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
检测模块202,用于逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息;否则,模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH ;
判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链;否则所述网站存在隐藏暗链,进入处置模块;
处置模块203,用于将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。
[0019]所述的系统中,所述处置模块,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0020]本发明的优势在于,提供了一种检测暗链的技术和实现,解决了目前检测暗链的局限性,对暗链基于特征码检测不全面的问题,可对隐藏的暗链进行检测;也解决了人工检测的滞后性问题,比传统检测方式效率更高。本发明基于用户代理模拟,同时采用内容匹配方式,不仅可以检测暗链,还可以恢复黑客植入的暗链,解决了传统检测暗链,只能查不能清除等特点。解决了对暗链处置清除的问题,无需人工参与处置问题。解决了传统特征码检测暗链需要人工参与,处置、添加规则是一个自闭合的过程。且本发明方法易于扩展、易于维护、可全自动运行,没有额外的开发及人工维护的开销,极大的方便了本发明方法的实现与运维。
[0021]本发明提出了一种暗链的检测方法及系统,通过建立搜索引擎蜘蛛用户代理信息库、暗链特征库和网站基本信息库,遍历网站基本信息库中的各网页,并将网页信息与暗链特征库进行对比,如果存在暗链特征库中的特征则所述的页面存在暗链,否则模拟搜索引擎蜘蛛用户代理信息,重新请求所述页面,并比较其HASH值与网站基本信息库中的HASH值是否相同,如果相同则所述页面不存在暗链,否则所述页面存在暗链。本发明的方法无需人为参与,即可对网站中的暗链进行检测并清除。极大提高了对暗链的检测效率。
[0022]通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0023]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0024]本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
[0025]本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0026]虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。
【主权项】
1.一种暗链的检测方法,其特征在于,包括: a.创建搜索引擎蜘蛛的用户代理信息库; 创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ; 创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ; b.逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束; c.判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链;否则,执行步骤d ; d.模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH; e.判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链,返回步骤b ;否则所述网站存在隐藏暗链,执行步骤f ; f.将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。2.如权利要求1所述的方法,其特征在于,所述步骤f,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。3.一种暗链的检测系统,其特征在于,包括: 建模模块:用于创建搜索引擎蜘蛛的用户代理信息库; 创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ; 创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ; 检测模块,用于逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束; 判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链;否则,模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH ; 判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链;否则所述网站存在隐藏暗链,进入处置模块; 处置模块,用于将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。4.如权利要求3所述的系统,其特征在于,所述处置模块,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
【专利摘要】本发明提出了一种暗链的检测方法及系统,通过建立搜索引擎蜘蛛用户代理信息库、暗链特征库和网站基本信息库,遍历网站基本信息库中的各网页,并将网页信息与暗链特征库进行对比,如果存在暗链特征库中的特征则所述的页面存在暗链,否则模拟搜索引擎蜘蛛用户代理信息,重新请求所述页面,并比较其HASH值与网站基本信息库中的HASH值是否相同,如果相同则所述页面不存在暗链,否则所述页面存在暗链。本发明的方法无需人为参与,即可对网站中的暗链进行检测并清除。极大提高了对暗链的检测效率。
【IPC分类】G06F21/56
【公开号】CN105488402
【申请号】CN201410807527
【发明人】尹尚书, 李柏松
【申请人】哈尔滨安天科技股份有限公司
【公开日】2016年4月13日
【申请日】2014年12月23日