利索能及
我要发布
收藏
专利号: 2014106661506
申请人: 北京国双科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-19
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文本内容的筛选方法,其特征在于,包括:

获取网页页面的文本内容;

添加筛选条件至目标词包,其中,所述目标词包为包括目标对象和关联对象的词包,所述目标对象为所述文本内容中的待筛选对象,所述关联对象为与所述目标对象具有关联关系的对象;以及利用具有所述筛选条件的所述目标词包对所述文本内容进行筛选,得到所述目标对象的目标内容。

2.根据权利要求1所述的筛选方法,其特征在于,添加筛选条件至目标词包包括:利用所述筛选条件关联所述目标对象和所述关联对象。

3.根据权利要求2所述的筛选方法,其特征在于,所述关联对象的数量为多个,所述筛选条件包括第一子条件和第二子条件,添加筛选条件至目标词包包括:分别利用所述第一子条件关联每个所述关联对象和所述目标对象,得到多个词包元素;以及利用所述第二子条件关联多个所述词包元素,得到具有所述筛选条件的所述目标词包。

4.根据权利要求2所述的筛选方法,其特征在于,所述关联对象的数量为多个,所述筛选条件包括第一子条件和第二子条件,添加筛选条件至目标词包包括:利用所述第一子条件关联至少一个所述关联对象和所述目标对象,得到至少一个第一词包元素;

利用所述第一子条件关联第一关联对象和第二关联对象,得到第二词包元素,其中,所述第一关联对象和所述第二关联对象均为多个所述关联对象中的对象;以及利用所述第二子条件关联所述至少一个第一词包元素和所述第二词包元素,得到具有所述筛选条件的所述目标词包。

5.根据权利要求1所述的筛选方法,其特征在于,在获取网页页面的文本内容之前,所述筛选方法还包括:接收选择指令,所述选择指令用于确定获取范围,

其中,获取网页页面的文本内容包括:在所述获取范围内获取所述文本内容。

6.一种文本内容的筛选装置,其特征在于,包括:

获取单元,用于获取网页页面的文本内容;

添加单元,用于添加筛选条件至目标词包,其中,所述目标词包为包括目标对象和关联对象的词包,所述目标对象为所述文本内容中的待筛选对象,所述关联对象为与所述目标对象具有关联关系的对象;以及筛选单元,用于利用具有所述筛选条件的所述目标词包对所述文本内容进行筛选,得到所述目标对象的目标内容。

7.根据权利要求6所述的筛选装置,其特征在于,所述添加单元包括:第一关联模块,用于利用所述筛选条件关联所述目标对象和所述关联对象。

8.根据权利要求7所述的筛选装置,其特征在于,所述关联对象的数量为多个,所述筛选条件包括第一子条件和第二子条件,所述添加单元还包括:第二关联模块,用于分别利用所述第一子条件关联每个所述关联对象和所述目标对象,得到多个词包元素;以及第三关联模块,用于利用所述第二子条件关联多个所述词包元素,得到具有所述筛选条件的所述目标词包。

9.根据权利要求7所述的筛选装置,其特征在于,所述关联对象的数量为多个,所述筛选条件包括第一子条件和第二子条件,所述添加单元还包括:第四关联模块,用于利用所述第一子条件关联至少一个所述关联对象和所述目标对象,得到至少一个第一词包元素;

第五关联模块,用于利用所述第一子条件关联第一关联对象和第二关联对象,得到第二词包元素,其中,所述第一关联对象和所述第二关联对象均为多个所述关联对象中的对象;以及第六关联模块,用于利用所述第二子条件关联所述至少一个第一词包元素和所述第二词包元素,得到具有所述筛选条件的所述目标词包。

10.根据权利要求6所述的筛选装置,其特征在于,所述筛选装置还包括:接收单元,用于在获取网页页面的文本内容之前,接收选择指令,所述选择指令用于确定获取范围,其中,所述获取单元包括获取模块,用于在所述获取范围内获取所述文本内容。