利索能及
我要发布
收藏
专利号: 2020103481348
申请人: 深圳市智佳家电子科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种抓取网络特定数据的分析方法,其特征在于,所述抓取网络特定数据的分析方法为数据首先经过过滤条件进入算法系统,先使用特征码模型对数据进行处理,如果没有找到目标数据,则转入区域模型进一步处理,如果依然失败,则视为不存在目标数据;

所述特征码模型是在生成模型期间,将目标数据区域的前后特定长度数据作为特征码,多次验证确定后,保存下来的最终模型,当数据进入该模型时,使用前后特征码在数据内比对,按相似度高低评分,并依次对前后特征码排列组合,每个组合对应一个数据区域,从高评分开始依次取出组合,将对应的数据域做规则检查,如果检查通过则数据取出成功;

所述区域模型是在生成模型期间,将目标数据区域所在数据位置作为区域,并提取部分其他数据作为锚点,多次验证确定后,保存下来的最终模型,当数据进入该模型时,先使用锚点进行比对,锚点所在区域与锚点数据重合率作为评分,当评分大于保存的平均评分时,使用区域取出目标数据并进行规则检查,如果数据长度有偏差,则在区域上对长度差值绝对值做扩展,检查通过则数据取出成功。