1.一种河流水质反演方法,其特征在于,所述方法包括以下步骤:获取河流区域的高光谱数据,对高光谱数据进行辐射校正,根据高光谱中的波段构建多个指标,计算每个指标与水质参数的相关性,按照相关性对指标排序,基于指标排序结果确定水质参数对应的指标集合;基于水质参数的相关性和水质参数的指标集合的相关性对水质参数聚类;
在训练过程中,对于每个簇,按照簇的指标集合中指标与簇中水质参数的相关性确定指标的重要性,基于指标的重要性确定每棵树进行分裂时的分裂指标选取概率,并根据簇的轮廓系数确定分裂停止条件;
使用训练好的模型对新的高光谱数据进行反演,得到水质参数。
2.如权利要求1所述的方法,其特征在于,所述计算每个指标与水质参数的相关性,具体为:采用多个预设模型对每个指标和水质参数进行拟合;所述多个预设模型为线性模型、二次多项式模型、三次多形式模型以及指数模式;
将所述多个预设模型的均方根误差或平均绝对百分比误差中的最小值作为指标与水质参数的相关性。
3.如权利要求1所述的方法,其特征在于,所述基于水质参数的相关性和水质参数的指标集合的相关性对水质参数聚类,具体为:通过线性模型建立两个水质参数的相关性关系,计算所述线性模型的均方根误差或平均绝对百分比误差,将所述均方根误差或平均绝对百分比误差作为水质参数的相关性;
计算两个水质参数的指标集合的交集和并集,并所述交集的个数和所述并集的个数的比值作为水质参数的指标集合的相关性;
通过水质参数的相关性和水质参数的指标集合的相关性计算水质参数之间的距离;
按照所述距离对水质参数聚类。
4.如权利要求3所述的方法,其特征在于,所述通过水质参数的相关性和水质参数的指标集合的相关性计算水质参数之间的距离,具体为:对水质参数的相关性进行平方计算后加权,将1减去水质参数的指标集合的相关性后进行平方后再加权,将两个平方加权的总和作为水质参数之间的距离。
5.如权利要求1所述的方法,其特征在于,所述按照簇的指标集合中指标与簇中水质参数的相关性确定指标的重要性,具体为:将簇中所有水质参数对应的指标集合的并集作为簇的指标集合;
对于簇的指标集合中的每个指标,若指标在簇中水质参数对应的指标集合中,则累加指标与水质参数的相关性得到指标的重要性。
6.如权利要求1所述的方法,其特征在于,所述基于指标的重要性确定每棵树进行分裂时的分裂指标选取概率,具体为:将簇的指标集合中每个指标的重要性取倒数后进行归一化,将归一化后的值作为分裂时的分裂指标选取概率。
7.如权利要求1所述的方法,其特征在于,所述根据簇的轮廓系数确定分裂停止条件,具体为:获取预设设置的停止分裂时树的最大深度、最小样本数以及信息增益阈值,计算簇的轮廓系数;
计算轮廓系数和调整因子的乘积,将所述最大深度和所述乘积的差作为树停止分裂时的最大深度;
将轮廓系数和最小样本数的乘积作为树停止分裂时的最小样本数;
将轮廓系数和信息增益阈值的乘积作为树停止分裂时的信息增益阈值。
8.一种河流水质反演系统,其特征在于,所述系统包括以下模块:数据采集模块,用于获取河流区域的高光谱数据,对高光谱数据进行辐射校正,根据高光谱中的波段构建多个指标,计算每个指标与水质参数的相关性,按照相关性对指标排序,基于指标排序结果确定水质参数对应的指标集合;基于水质参数的相关性和水质参数的指标集合的相关性对水质参数聚类;
训练模块,用于在训练过程中,对于每个簇,按照簇的指标集合中指标与簇中水质参数的相关性确定指标的重要性,基于指标的重要性确定每棵树进行分裂时的分裂指标选取概率,并根据簇的轮廓系数确定分裂停止条件;
反演模块,用于使用训练好的模型对新的高光谱数据进行反演,得到水质参数。
9.如权利要求8所述的系统,其特征在于,所述计算每个指标与水质参数的相关性,具体为:采用多个预设模型对每个指标和水质参数进行拟合;所述多个预设模型为线性模型、二次多项式模型、三次多形式模型以及指数模式;
将所述多个预设模型的均方根误差或平均绝对百分比误差中的最小值作为指标与水质参数的相关性。
10.一种计算机存储设备,所述存储设备上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1‑7任一项所述的方法。