1.基于多算法交互的数据采集方法,其特征在于,包括如下方法步骤:S1、利用多个传感器收集数据,作为传感器节点数据;其中传感器收集过程包括数据采集频率和数据传输频率;
S2、利用随机森林算法模型对所述传感器节点数据进行异常分析,生成当前分析结果;
其中:
若当前分析结果为异常时,根据异常结果对S1进行反馈,通过对异常结果中对应的传感器节点数据,进行数据采集频率的调整,并再次进行S2,若当前分析结果为异常时,则将异常结果发送给管理人员;
若当前分析结果为正常时,将执行S3;
S3、利用时间序列分析算法对所述传感器节点数据进行分析,得出时间序列结果,并根据长短期记忆网络算法对所述时间序列结果进行综合分析;其中:若综合分析结果为异常时,根据综合分析结果的异常对S1进行反馈,通过对综合分析结果中对应的传感器节点数据,进行数据传输频率的调整,以及增加该传感器节点数据的权重;
若综合分析结果为正常时,则完成数据采集以及异常分析;
所述随机森林算法模型训练步骤如下:
样本选择:从训练数据集 中通过自助法随机抽取 个样本,生成多个子样本集;
特征选择:对每个决策树的节点,从所有特征中随机选择 个特征,其中 ,从中选出最佳特征用于分裂,其中 为所有特征的数量;
对每个子样本集,构建一棵决策树,具体步骤如下:
分裂节点:通过基尼系数作为分裂条件,从随机选择的 个特征中找到最佳分裂特征,基尼系数公式为: ,其中 表示第 类样本在训练数据集中的频率, 表示训练数据集中类别的总数;
递归构建:依据最佳特征分割数据集,递归地对分割后的子数据集进行上述分裂,直到满足停止条件,停止条件包括但不限于达到树的最大深度;
模型融合:通过集成的方式将所有训练好的决策树组合在一起,对于输入的特征向量,每棵决策树独立地对其进行分类,输出类别 ;使 用 多 数 投票 法 来 确 定 输 入 数 据 的 最 终 预 测 类 别 ,公 式 为 :,其中 为决策树的总数量, 代表多数投票;
所述随机森林算法模型根据传感器节点数据进行异常分析的步骤如下:将当前时刻传感器节点数据 输入到训练好的随机森林模型中;
随机森林模型输出对应的分类结果 ;其中:
若 时,表示当前分析结果为异常,并标记对应的异常数据点反馈给S1,根据异常数据点选择对应的传感器节点,调整S1中对应的传感器节点的数据采集频率,通过将采集间隔减小,增加采集频率,再次进行S2的异常分析,若此时的当前分析结果仍为异常时,则将异常结果发送给管理人员;
若 时,表示当前分析结果为正常,将执行S3;
所述利用时间序列分析算法对传感器节点数据进行分析,得出时间序列结果,具体包括:提取时间序列中的季节性成分 、趋势成分 、和残差 ;其中:季节性成分 的计算如下:
通过移动窗口平滑对数据进行平滑处理;
在每个周期内,对每个时间点进行局部多项式拟合;
滑动窗口左移一个时间步,再次进行局部平滑,直到遍历整个时间序列;
趋势成分 的计算如下:
从原始时间序列数据中减去季节性成分 以得到去季节性数据;
通过移动平均对去季节性数据平滑处理,以得到趋势成分;
构建一个大于季节性窗口的滑动窗口;
对时间序列数据进行局部多项式拟合,得到平滑后的趋势成分;
残差 的计算如下:
从原始时间序列中减去提取出的趋势成分 和季节性成分 ;
最后,时间序列结果 的计算为: 。
2.根据权利要求1所述的基于多算法交互的数据采集方法,其特征在于,所述数据采集频率进行初始化设置,通过传感器节点周期性地采集数据;所述数据传输频率进行初始化设置,传感器节点数据通过无线方式进行传输。
3.根据权利要求1所述的基于多算法交互的数据采集方法,其特征在于,所述长短期记忆网络算法模型的架构包括输入门、遗忘门、候选记忆单元信息、记忆单元状态更新、输出门和隐藏状态输出,通过输入门和遗忘门控制当前输入信息和过去记忆的保留和更新,结合候选记忆单元生成新的记忆状态,并通过输出门生成综合短期和长期信息的隐藏状态进行预测;所述长短期记忆网络算法模型训练通过设置一个目标函数,通过反向传播算法,调整模型的参数。
4.根据权利要求3所述的基于多算法交互的数据采集方法,其特征在于,所述长短期记忆网络算法模型预测综合分析结果的步骤如下:长短期记忆网络算法模型训练完成后,对于给定的输入序列,长短期记忆网络算法模型输出当前时间步的预测值和隐藏状态;
通过比较模型的预测值和实际值确定当前预测误差,并判定当前预测误差是否为异常,其中:若综合分析结果为异常时,将当前时间列数据所对应的传感器节点作为综合分析的结果反馈给S1,基于综合分析结果,识别出传感器节点,调整该传感器节点的数据传输频率,通过将数据传输间隔减小,增加数据传输频率;以及增加S2中数据集 中对应的传感器节点数据的权重,通过固定步长的方法进行权重的增加;
若综合分析结果为正常时,则完成数据采集以及分析。
5.根据权利要求4所述的基于多算法交互的数据采集方法,其特征在于,所述比较和判定过程通过计算历史预测误差的均值和标准差,设定一个基于标准差的阈值范围,若当前预测误差超过阈值范围,则认定为异常;否则为正常。
6.一种使用包括权利要求1‑5中任意一项所述的基于多算法交互的数据采集方法的系统,其特征在于,包括数据收集模块(100)、数据分析模块(200)和综合分析模块(300),其中:所述数据收集模块(100)利用多个传感器收集数据,作为传感器节点数据;其中传感器收集过程包括数据采集频率和数据传输频率;
所述数据分析模块(200)利用随机森林算法模型对所述传感器节点数据进行异常分析,生成当前分析结果;其中:若当前分析结果为异常时,根据异常结果对数据收集模块(100)进行反馈,通过对异常结果中对应的传感器节点数据,进行数据采集频率的调整,并再次进行数据分析模块(200),若当前分析结果为异常时,则将异常结果发送给管理人员;
若当前分析结果为正常时,将执行所述综合分析模块(300);
所述综合分析模块(300)利用时间序列分析算法对所述传感器节点数据进行分析,得出时间序列结果,并根据长短期记忆网络算法对所述时间序列结果进行综合分析;其中:若综合分析结果为异常时,根据综合分析结果的异常对数据收集模块(100)进行反馈,通过对综合分析结果中对应的传感器节点数据,进行数据传输频率的调整,以及增加该传感器节点数据的权重;
若综合分析结果为正常时,则完成数据采集以及异常分析。