1.一种网页链接有效性验证方法,其特征在于,包括:确定待验证的网页链接地址;
判断所述待验证的网页链接地址对应的网页是否可以访问;
如果所述待验证的网页链接地址对应的网页可以访问,则获取所述待验证的网页链接地址对应的网页;
解析所述待验证的网页链接地址对应的网页,判断所述待验证的网页链接地址对应的网页中是否包含预设域名或预设关键词,其中,通过所述预设关键词可以链接到所述预设域名对应的网站;以及如果所述待验证的网页链接地址对应的网页中包含所述预设域名或者所述预设关键词,则确定所述待验证的网页链接地址为有效的网页链接地址,其中,将所述网页链接地址有效性的验证结果存储在列表中,所述列表用于计算网页链接虚拟资源。
2.根据权利要求1所述的方法,其特征在于,判断所述待验证的网页链接地址对应的网页是否可以访问包括:向所述待验证的网页链接地址发出访问请求;
获取所述待验证的网页链接地址返回的对应所述访问请求的状态码;以及根据所述状态码判断所述待验证的网页链接地址对应的网页是否可以访问。
3.根据权利要求1所述的方法,其特征在于,通过解析所述待验证的网页链接地址对应的网页,判断所述待验证的网页链接地址对应的网页中是否包含所述预设域名或所述预设关键词包括:读取所述预设域名;
将读取的预设域名与所述待验证的网页链接地址对应的网页进行对比,判断所述读取的预设域名是否出现在所述待验证的网页链接地址对应的网页中;
如果所述读取的预设域名没有出现在所述待验证的网页链接地址对应的网页中,则读取所述预设关键词;以及将读取的预设关键词与所述待验证的网页链接地址对应的网页进行对比,判断所述读取的预设关键词是否出现在所述待验证的网页链接地址对应的网页中,或者,读取所述预设关键词;
将读取的预设关键词与所述待验证的网页链接地址对应的网页进行对比,判断所述读取的预设关键词是否出现在所述待验证的网页链接地址对应的网页中;
如果所述读取的预设关键词没有出现在所述待验证的网页链接地址对应的网页中,则读取所述预设域名;以及将读取的预设域名与所述待验证的网页链接地址对应的网页进行对比,判断所述读取的预设域名是否出现在所述待验证的网页链接地址对应的网页中。
4.根据权利要求1所述的方法,其特征在于,确定待验证的网页链接地址包含确定多个待验证的网页链接地址,确定所述待验证的网页链接地址为有效的网页链接地址之后,所述方法还包括:统计所述待验证的网页链接地址的数量;
统计所述有效的网页链接地址的数量;以及
根据所述有效的网页链接地址的数量和所述待验证的网页链接地址的数量计算网站链接存活率。
5.根据权利要求1所述的方法,其特征在于,确定所述待验证的网页链接地址为有效的网页链接地址之后,所述方法还包括:获取预设网页链接虚拟资源结算公式,其中,所述预设网页链接虚拟资源结算公式用于根据所述有效的网页链接地址的数量计算网页链接虚拟资源;以及按照所述预设网页链接虚拟资源结算公式计算网页链接虚拟资源。
6.根据权利要求5所述的方法,其特征在于,按照所述预设网页链接虚拟资源结算公式计算网页链接虚拟资源包括按照以下方式计算所述网页链接虚拟资源:统计所述有效的网页链接地址的数量;
确定网页链接单价;以及
按照以下公式计算所述网页链接虚拟资源:
Q=S*P,
其中,Q为所述网页链接虚拟资源,S为所述有效的网页链接地址的数量,P为所述网页链接单价。
7.根据权利要求1所述的方法,其特征在于,判断所述待验证的网页链接地址对应的网页是否可以访问之后,所述方法还包括:如果所述待验证的网页链接地址对应的网页不可访问,则删除所述待验证的网页链接地址。
8.根据权利要求1所述的方法,其特征在于,判断所述待验证的网页链接地址对应的网页中是否包含所述预设域名或者所述预设关键词之后,所述方法还包括:如果所述待验证的网页链接地址对应的网页中不包含所述预设域名和所述预设关键词,则删除所述待验证的网页链接地址。
9.一种网页链接有效性验证装置,其特征在于,包括:第一确定单元,用于确定待验证的网页链接地址;
第一判断单元,用于判断所述待验证的网页链接地址对应的网页是否可以访问;
获取单元,用于在所述待验证的网页链接地址对应的网页可以访问时,获取所述待验证的网页链接地址对应的网页;
第二判断单元,用于解析所述待验证的网页链接地址对应的网页,判断所述待验证的网页链接地址对应的网页中是否包含预设域名或预设关键词,其中,通过所述预设关键词可以链接到所述预设域名对应的网站;以及第二确定单元,用于在所述待验证的网页链接地址对应的网页中包含所述预设域名或者所述预设关键词时,确定所述待验证的网页链接地址为有效的网页链接地址,其中,将所述网页链接地址有效性的验证结果存储在列表中,所述列表用于计算网页链接虚拟资源。
10.根据权利要求9所述的装置,其特征在于,所述第一判断单元包括:访问模块,用于向所述待验证的网页链接地址发出访问请求;
获取模块,用于获取所述待验证的网页链接地址返回的对应所述访问请求的状态码;
以及
判断模块,用于根据所述状态码判断所述待验证的网页链接地址对应的网页是否可以访问。