1.一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述系统包括:
数据预处理模块:用于获取农业大棚内至少一种环境指标的监测数据的时序序列及农业大棚外所述时序序列的参考时序序列;在每种环境指标的所述时序序列中,根据相邻监测数据的幅值增长率对对应所述时序序列进行分段;
数据分析模块:用于在每种环境指标的每个分段中,根据每个监测数据与分段中位监测数据的幅值差异,及所述参考时序序列中对应环境指标的幅值变化情况,获取每个监测数据在对应分段内的离群程度;在每种环境指标的每个分段中,根据每个监测数据与其余监测数据的幅值差异及对应所述离群程度,获取每个监测数据的局部距离;在每种环境指标的每个监测数据的对应分段内,根据对应监测参数与分段内其余监测数据的所述局部距离的差异,及分段内其余监测数据的所述离群程度,获取每个监测数据的所述局部距离的调整权重;
数据优化模块:用于根据所述调整权重和所述局部距离获取每个监测数据在对应分段内的K邻域参数;根据所述K邻域参数对每种环境指标的每个分段内的监测数据进行离群检测,获取每种环境指标的监测数据的优化时序序列;
所述时序序列的分段方法包括:
以任一环境指标的所述时序序列为目标时序序列,以所述目标时序序列中的第一个监测数据作为第一分段序列的首个元素,第二个监测数据作为第一分段序列的第二元素,沿所述目标时序序列的时序方向依次向第一分段序列中添加监测数据,直至满足预设截止条件后,停止向对应所述分段序列内添加监测数据,并以本次添加过程中最后添加的监测数据的前一相邻监测数据为对应所述分段序列的终点,从而得到第一分段序列;将所述第一分段序列的终点的后一监测数据作为第二分段序列的首个元素,将首个元素的下一相邻时序对应监测数据作为第二分段序列的第二元素,迭代获取所述目标时序序列中的所有分段序列;
所述预设截止条件为:在向每个所述分段序列添加监测数据后,计算当前所述分段序列中最后一个监测数据相对倒数第二个监测数据的末端幅值增长率,计算倒数第二个监测数据相对倒数第三个监测数据的次末端幅值增长率,所述末端幅值增长率与所述次末端幅值增长率的差异大于预设阈值。
2.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述离群程度的计算公式包括:其中, 为第q种环境指标的时序序列的第i个分段
中第t个监测数据的离群程度; 为第q种环境指标的时序序列的第i个分段中第t个监测数据的幅值; 为第q种环境指标的时序序列的第i个分段中监测数据的幅值中值; 为第q种环境指标的时序序列的第i个分段中监测数据的幅值的上四分位数; 为第q种环境指标的第i个分段中监测数据的幅值的下四分位数; 为第q种环境指标的参考时序序列中与对应时序序列的第i个分段中第t个监测数据为相同时刻所采集的农业大棚外的监测数据的幅值; 为第q种环境指标的参考时序序列中与对应时序序列的第i个分段中第t个监测数据为相同时刻所采集的农业大棚外的监测数据的幅值均值;α为预设第一正参数。
3.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述局部距离的计算公式包括:其中, 为第q种环境指标的时序序列的第i个分段中第n
个监测数据的局部距离;t为第q种环境指标的时序序列的第i个分段中除第n个监测数据外的所有监测数据的序号; 为第q种环境指标的时序序列的第i个分段中第t个监测数据的幅值; 为第q种环境指标的时序序列的第i个分段中第n个监测数据的幅值; 为第q种环境指标的时序序列的第i个分段中除去第n个监测数据后监测数据的总数量; 为第q种环境指标的时序序列的第i个分段中第t个监测数据的离群程度;β为预设第二正参数。
4.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述调整权重的计算公式包括:其中, 为第q种环境指标的时序序列
的第i个分段中第n个监测数据的局部距离的调整权重;t为第q种环境指标的时序序列的第i个分段中除第n个监测数据外的所有监测数据的序号; 为第q种环境指标的时序序列的第i个分段中第t个监测数据的离群程度; 为第q种环境指标的时序序列的第i个分段中第n个监测数据的局部距离; 为第q种环境指标的时序序列的第i个分段中第t个监测数据的局部距离; 为第q种环境指标的时序序列的第i个分段中除去第n个监测数据后监测数据的总数量;norm()为标准归一化函数;c为预设第三正参数。
5.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述K邻域参数的获取方法包括:根据每种环境指标的每个监测数据的所述局部距离及对应所述调整权重获取每个监测数据在对应分段中的局部密度参数;将所述局部密度参数归一化后映射到对数函数中,将对数函数值向上取整得到每个监测数据在对应分段中的K邻域参数,对数函数的底数小于1且大于0。
6.根据权利要求5所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述局部密度参数的获取方法包括:将每个监测数据的所述局部距离乘以对应所述调整权重,得到每个监测数据在对应分段中的置信局部距离;将所述置信局部距离进行负相关映射得到每个监测数据在对应分段中的局部密度参数。
7.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,对每种环境指标的每个分段内的监测数据进行离群检测的方法为COF算法。
8.根据权利要求1所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述优化时序序列的获取方法包括:获取每种环境指标的所述时序序列中每个监测数据的离群得分值;根据所述离群得分值在每种环境指标的所述时序序列中筛选出所有噪声监测数据并剔除,将与所述噪声监测数据对应时序最近的两个非噪声监测数据的幅值均值作为所述噪声监测数据的修正值,填补剔除数据,得到每种环境指标的监测数据的优化时序序列。
9.根据权利要求8所述的一种基于物联网的农业大棚数据优化采集系统,其特征在于,所述噪声监测数据的获取方法包括:在每种环境指标下,以每个监测数据的所述离群得分值为横坐标,所述离群得分值在所有所述离群得分值中的出现频次为纵坐标构建频次直方图,将所述频次直方图中出现频次最大的所述离群得分值作为参考离群得分值,将所有大于所述参考离群得分值的所述离群得分值对应监测数据作为对应环境指标的所述时序序列中的噪声监测数据。