买专利、卖专利、专利购买、专利交易、专利出售、高企申报-基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

基于随机森林和IFDA优化CNN-GRU的中长期径流预测方法

￥12000

专利号： 2021116107827

申请人：淮阴工学院

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法，其特征在于，包括以下步骤：(1)预先获取旬径流历史数据以及历史旬降雨数据，对数据进行预处理，并分为训练集和测试集；

(2)构建CNN‑GRU混合预测模型，并确认卷积神经网络的输入层、卷积层、池化层，输出层；以及门控循环单元的输入层、隐藏层和输出层；

(3)使用改进后的流向算法IFDA优化CNN‑GRU混合预测模型：先采用混沌算法对流向算法进行初始化，然后使用改进后的流向算法优化CNN‑GRU模型的学习率以及隐含层节点个数，最后建立基于改进的流向算法IFDA优化CNN‑GRU的混合模型IFDA‑CNN‑GRU；

(4)使用训练集对建立好的IFDA‑CNN‑GRU模型进行训练，将测试集送入训练好的模型中运行，得到预测结果；

所述步骤(1)实现过程如下：

将N个水文站点的径流数据和降雨数据分为N个径流数据集和N个降雨数据集；使用随机森林RF对(N+N)个降雨和径流数据所构成的高维因子集进行因子选择，根据变量重要性评分挑选对旬径流影响较大的因子集；

采用bootstrap有放回抽样方法进行抽样，判断重要性的计算公式如下：VIF＝∑(OBB2‑OBB1)/k (1)其中，VIF为重要性，OBB1为利用袋内数据构建随机森林模型得到的袋外数据误差；OBB2为在袋外数据的样本中，随机改变其中的某些数据要素后，得到的袋外误差；k为随机森林决策树数量；

设定随机森林中树的数量为k，利用bootstrap有放回抽样方法随机在原始样本中抽取与原始样本容量相同的样本，重复k次，把每一次的抽样结果作为每棵决策树的输入；每棵决策树根据二叉树分类原则得到每棵树的分类结果，并对因子集进行重要性排序；删除当前高维因子集中不重要的因子，选择重要性前85％的因子集作为最后的输出；

将随机森林RF处理过的数据集分为训练集和测试集，其中训练集占总数据集的70％，测试集占总数据集的30％；

所述步骤(3)包括以下步骤：

(31)随机生成一个向量X＝[xm1,xm2,...,xmn]，且每个分量都在[0,1]之间；

(32)采用Circle映射得到混沌序列：

(33)将混沌序列的各个分量映射回取值范围，得到新的初始化位置公式：Fl_X(i)＝lb+xmn*(ub‑lb) (11)其中，流向周围还有c个邻域，邻域的位置公式如下：

Ne_X(j)＝Fl_X(i)+rand*△ (12)其中，Ne_X(j)表示第j个邻域的位置，△若为小数字则在小范围内搜索，若为大数字则在大范围内搜索；

(34)为了确定流向的新位置，还要确定流向的流速矢量V,计算公式如下：V＝randn*S (13)式中，randn为随机数，S表示流的邻域和当前位置之间的斜率向量；

流向新位置更新公式如下：

式中Fl_newX(i)表示流向的新位置，同时模拟流向的具体计算公式如下：式中，Fl_fit(r)为随机适应度值，Fl_fit(i)为第i条流向的适应度值，Best_X为流向最好的位置，r为随机整数；

(35)使用改进后的流向算法优化CNN‑GRU模型的学习率以及隐含层节点个数，建立混合模型IFDA‑CNN‑GRU。

2.根据权利要求1所述的基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法，其特征在于，所述步骤(2)实现过程如下：卷积神经网络在卷积层通过卷积运算从输入特征图中提取数据块，然后对所有的数据块应用相同的变换，生成输出特征图，并对输出特征图进行空间重组，输出特征图中的每个空间位置都对应于输入特征图中的相同位置；卷积层公式如下：式中，Conk为卷积层输出的第k个卷积核的特征图；α为激活函数；Wtk为当前卷积层第k个卷积核的权重矩阵；Bik为当前卷积层第k个卷积核的偏置；为卷积运算；k为卷积核的个数；

池化层对卷积层输出的信息进行降维处理，去除冗余信息的同时加快计算速度：O＝max Conk (3)

式中，O为池化层的输出；Conk为池化层的输入；

将CNN输出的数据矩阵输入GRU，GRU模型包含重置门和更新门，具体运算公式如下：at＝σ(Wa·[dt‑1,xt]) (4)bt＝σ(Wb·[dt‑1,xt]) (5)kt＝σ(Wo·dt) (8)其中，kt为t时间点GRU单元的所有输出，tanh和σ分别是正切激活函数和Sigmoid激活函数，at，bt分别是t时间点重置门和更新门的计算方法，包含了当前输入xt的数据，有目的性的将添加到当前的隐藏状态；门控信号b的范围为[0,1]，b越接近1，表示“记忆”下来的信息越多，而接近0则表示“遗忘”的信息越多；(1‑bt)*dt‑1表示对原本隐藏状态的选择性“遗忘”，b可以看作遗忘门，去除dt‑1维度中某些不重要的信息；表示对含有当前输入数据信息的进行筛选“记忆”，对维度中的信息进行选择。

3.根据权利要求1所述的基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法，其特征在于，所述步骤(34)包括以下步骤：(341)生成初始人口或流量，由以下矩阵表示：

(342)评估目标函数并得到最佳目标函数作为输出；

(343)设定每条流向拥有c个邻域且半径为△；

(344)通过计算每个邻域的目标函数值来确定最佳邻域；

(345)如果最佳邻域的目标函数比当前流向的目标函数更好，则应执行步骤(346)，否则执行步骤(347)；

(346)根据公式(13)和公式(14)更新流速以及流向的最佳邻域；

(347)根据公式(15)更新流向的位置；

(348)计算新流向的目标函数，如果它比以前的流向结果更好，则更新流向的位置；

(349)如果满足终止条件，则得到最佳结果，否则重复步骤(343)到(347)。