利索能及
我要发布
收藏
专利号: 2014107795885
申请人: 北京国双科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-19
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种网页页面内容的获取方法,其特征在于,包括:

对加载的原始网页页面进行处理,生成初始网页页面,以读取所述初始网页页面的文本信息;

从所述初始网页页面中查找到按钮集合;

依据所述按钮集合创建和触发所述初始网页页面的点击事件,生成目标网页页面;

读取所述目标网页页面的文本信息;

依据所述初始网页页面的文本信息和所述目标网页页面的文本信息获取所述原始网页页面的文本信息。

2.根据权利要求1所述的方法,其特征在于,在从所述初始网页页面中查找到按钮集合之前,所述方法还包括:调用判断函数判断所述初始网页页面是否存在所述点击按钮,得到判断结果。

3.根据权利要求2所述的方法,其特征在于,在所述判断结果为存在所述点击按钮的情况下,从所述初始网页页面中查找到按钮集合的步骤包括:调用第一查找函数从所述初始网页页面中查找所述点击按钮,以得到所述按钮集合;

在所述判断结果为不存在所述点击按钮的情况下,从所述初始网页页面中查找到按钮集合的步骤包括:调用第二查找函数从所述初始网页页面中查找点击元素、标签、翻页类,以得到所述按钮集合。

4.根据权利要求1所述的方法,其特征在于,在依据所述初始网页页面的文本信息和所述目标网页页面的文本信息获取所述原始网页页面的文本信息之前,所述方法还包括:通过调用比较函数对所述初始网页页面的文本信息和所述目标网页页面的文本信息进行比较,比较所述初始网页页面的文本信息和所述目标网页页面的文本信息是否相同。

5.根据权利要求4所述的方法,其特征在于,依据所述初始网页页面的文本信息和所述目标网页页面的文本信息获取所述原始网页页面的文本信息的步骤包括:在比较所述初始网页页面的文本信息和所述目标网页页面的文本信息相同的情况下,则所述目标网页页面的文本信息为所述原始网页页面的文本信息;

或,在比较所述初始网页页面的文本信息和所述目标网页页面的文本信息不相同的情况下,调用并集函数对所述初始网页页面的文本信息和所述目标网页页面的文本信息取并集,以获取所述原始网页页面的文本信息。

6.一种网页页面内容的获取装置,其特征在于,包括:

加载模块,用于对加载的原始网页页面进行处理,生成初始网页页面,以读取所述初始网页页面的文本信息;

查找模块,用于从所述初始网页页面中查找到按钮集合;

生成模块,用于依据所述按钮集合创建和触发目标网页页面的点击事件,生成所述目标网页页面;

读取模块,用于读取所述目标网页页面的文本信息;

获取模块,用于依据所述初始网页页面的文本信息和所述目标网页页面的文本信息获取所述原始网页页面的文本信息。

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:判断模块,用于从所述初始网页页面中查找到按钮集合之前,调用判断函数判断所述初始网页页面是否存在点击按钮,得到判断结果。

8.根据权利要求7所述的装置,其特征在于,所述查找模块包括:第一查找单元,用于在所述判断结果为存在所述点击按钮的情况下,从所述初始网页页面中查找到目标网页页面按钮包括:调用第一查找函数从所述初始网页页面中查找所述点击按钮,以得到所述按钮集合;

第二查找单元,用于在所述判断结果为不存在所述点击按钮的情况下,从所述初始网页页面中查找到目标网页页面按钮包括:调用第二查找函数从所述初始网页页面中查找点击元素、标签、翻页类,以得到所述按钮集合。

9.根据权利要求6所述的装置,其特征在于,所述获取模块包括:比较单元,用于依据所述初始网页页面的文本信息和所述目标网页页面的文本信息获取所述原始网页页面的文本信息之前,通过调用比较函数对所述初始网页页面的文本信息和所述目标网页页面的文本信息进行比较,比较所述初始网页页面的文本信息和所述目标网页页面的文本信息是否相同。

10.根据权利要求9所述的装置,其特征在于,所述获取模块还包括:第一获取单元,用于在比较所述初始网页页面的文本信息和所述目标网页页面的文本信息相同的情况下,则所述目标网页页面的文本信息为所述原始网页页面的文本信息;

或,第二获取单元,用于在比较所述初始网页页面的文本信息和所述目标网页页面的文本信息不相同的情况下,调用并集函数对所述初始网页页面的文本信息和所述目标网页页面的文本信息取并集,以获取所述原始网页页面的文本信息。