1.一种基于大数据的环境污染评估与监测方法,其特征在于,所述方法包括:获取不同气象参数在不同时刻的原始数据点,其中不同气象参数的采样间隔不同;
根据每种气象参数中原始数据点的分布,获得每个原始数据点的突变程度以及气象参数中的极值点;根据每种气象参数中所有原始数据点的所述突变程度、所述极值点的分布以及所述极值点的数量,获得气象参数的区分度;
将任意一种气象参数作为待测气象参数,根据每种气象参数中原始数据点的数值,对待测气象参数与其他气象参数进行相关性分析获得相关性系数;根据所有气象参数的采样间隔获得待测气象参数中每个原始数据点的时序范围;根据所述待测气象参数和其他气象参数在所述时序范围内的原始数据点的分布、所述采样间隔的差异、所述相关性系数和所述区分度,获得待测气象参数中每个原始数据点的参考价值;
对每种气象参数进行插值处理获得不同的插值曲线;根据每种气象参数中每个时刻的原始数据点和插值曲线在对应时刻的数据点的差异以及所述参考价值,获得最优插值曲线;根据所有气象参数的所述最优插值曲线对环境污染进行评估监测;
所述根据每种气象参数中所有原始数据点的所述突变程度、所述极值点的分布以及所述极值点的数量,获得气象参数的区分度包括:基于极值点所在的位置,对每种气象参数中所有原始数据点进行划分,获得不同的极值区间,所述极值区间中的原始数据点不包括极值点;
将每个原始数据点所在极值区间中原始数据点的数量,作为每个原始数据点的初始权重,其中所述极值点的初始权重为0;
对所述初始权重进行归一化处理,获得每个原始数据点的最终权重;
根据所述最终权重,对每种气象参数中对应的原始数据点的突变程度进行加权求和,获得气象参数的整体突变程度;
将每种气象参数中的极值点数量与对应气象参数中原始数据点的总数量的比值,作为气象参数的极值点比重;
将所述整体突变程度和所述极值点比重的乘积值进行归一化处理,获得气象参数的波动特征值;将所述波动特征值进行负相关映射获得每种气象参数与噪声之间的区分度;
所述根据所述待测气象参数和其他气象参数在所述时序范围内的原始数据点的分布、所述采样间隔的差异、所述相关性系数和所述区分度,获得待测气象参数中每个原始数据点的参考价值包括:将待测气象参数的采样间隔与每个其他气象参数的采样间隔的差值的绝对值,作为采样间隔差异,对所述采样间隔差异进行负相关的归一化处理,获得第一系数;
将待测气象参数与每个其他气象参数之间的相关性系数,作为第二系数;
将每个其他气象参数在所述时序范围内的原始数据点的标准差,作为其他气象参数在时序范围内的波动程度;对所述波动程度进行负相关的归一化处理后与对应气象参数的所述区分度相乘,获得第三系数;
将所述第一系数、所述第二系数和所述第三系数相乘,获得每个其他气象参数的调整系数;
基于DTW算法,对所述待测气象参数和每个其他气象参数在所述时序范围内的原始数据点进行动态时间规整处理,获得待测气象参数与每个其他气象参数在时序范围内的相似程度;将所有所述相似程度的平均值作为整体相似度;
将每个所述相似程度与所述整体相似度的差值与所述调整系数相乘,获得每个其他气象参数的相似度偏差;
对所有其他气象参数的相似度偏差的平方和求平均后进行归一化处理,获得待测气象参数中每个原始数据点的参考价值;
所述根据每种气象参数中每个时刻的原始数据点和插值曲线在对应时刻的数据点的差异以及所述参考价值,获得最优插值曲线包括:将每种气象参数中每个时刻的原始数据点和插值曲线在对应时刻的数据点的差值,作为每个原始数据点的初始插值误差;
将所述初始插值误差与所述参考价值的乘积,作为每个原始数据点的优化插值误差;
对所有原始数据点的优化插值误差的平方和求平均,获得每个插值曲线的整体插值误差;
将整体插值误差的最小值对应的插值曲线作为每种气象参数的最优插值曲线。
2.根据权利要求1所述的一种基于大数据的环境污染评估与监测方法,其特征在于,所述根据每种气象参数中原始数据点的分布,获得每个原始数据点的突变程度以及气象参数中的极值点包括:获取每个原始数据点相距最近的两个相邻数据点,所述原始数据点与对应的所述相邻数据点之间的时间间隔等于采样间隔,其中每种气象参数中第一个原始数据点和最后一个原始数据点分别作为自身的一个相邻数据点;若原始数据点同时大于或小于对应的两个相邻数据点,则将原始数据点作为极值点;
将原始数据点分别与每个相邻数据点的差值的绝对值作为初始变化值,将原始数据点与对应的两个相邻数据点的所述初始变化值的和值作为第一突变系数;
将原始数据点对应的两个相邻数据点的差值的绝对值,作为第二突变系数;
获取每个原始数据点的突变程度,所述突变程度与所述第一突变系数呈正相关,所述突变程度与所述第二突变系数呈负相关。
3.根据权利要求1所述的一种基于大数据的环境污染评估与监测方法,其特征在于,所述根据每种气象参数中原始数据点的数值,对待测气象参数与其他气象参数进行相关性分析获得相关性系数包括:根据待测气象参数中所有原始数据点的数值和其他每个气象参数中所有原始数据点的数值,获取皮尔逊相关系数,将所述皮尔逊相关系数作为待测气象参数与其他每个气象参数之间的相关性系数。
4.根据权利要求1所述的一种基于大数据的环境污染评估与监测方法,其特征在于,所述根据所有气象参数的采样间隔获得待测气象参数中每个原始数据点的时序范围包括:将所有气象参数的采样间隔的最小公倍数,作为标准采样时长;
将所述标准采样时长与所述待测气象参数的采样间隔的比值,作为待测气象参数的标准采样数量;
将待测气象参数中与每个原始数据点所在时刻相距最近的标准采样数量个其他原始数据点,作为原始数据点的参考数据点;
获取每个原始数据点的时序范围,所述时序范围的左端点为对应所述参考数据点所在时刻的最小值,所述时序范围的右端点为对应所述参考数据点所在时刻的最大值。
5.根据权利要求1所述的一种基于大数据的环境污染评估与监测方法,其特征在于,所述对每种气象参数进行插值处理获得不同的插值曲线包括:获取预设初始平滑参数,根据梯度下降法对所述预设初始平滑参数进行优化获得不同的调整平滑参数;
基于三次样条插值算法,使用每个所述调整平滑参数对每种气象参数进行插值处理,获得气象参数在不同调整平滑参数下的插值曲线。
6.根据权利要求1所述的一种基于大数据的环境污染评估与监测方法,其特征在于,所述根据所有气象参数的所述最优插值曲线对环境污染进行评估监测包括:在所有气象参数的最优插值曲线上分别选取相同时序的数据点,获取每种气象参数的数据点序列,将所有气象参数的数据点序列输入空气质量评估算法中进行环境污染的评估监测。
7.一种基于大数据的环境污染评估与监测系统,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1 6任意一项所述方法的步骤。
~