利索能及
我要发布
收藏
专利号: 2021116107827
申请人: 淮阴工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法,其特征在于,包括以下步骤:(1)预先获取旬径流历史数据以及历史旬降雨数据,对数据进行预处理,并分为训练集和测试集;

(2)构建CNN‑GRU混合预测模型,并确认卷积神经网络的输入层、卷积层、池化层,输出层;以及门控循环单元的输入层、隐藏层和输出层;

(3)使用改进后的流向算法IFDA优化CNN‑GRU混合预测模型:先采用混沌算法对流向算法进行初始化,然后使用改进后的流向算法优化CNN‑GRU模型的学习率以及隐含层节点个数,最后建立基于改进的流向算法IFDA优化CNN‑GRU的混合模型IFDA‑CNN‑GRU;

(4)使用训练集对建立好的IFDA‑CNN‑GRU模型进行训练,将测试集送入训练好的模型中运行,得到预测结果;

所述步骤(1)实现过程如下:

将N个水文站点的径流数据和降雨数据分为N个径流数据集和N个降雨数据集;使用随机森林RF对(N+N)个降雨和径流数据所构成的高维因子集进行因子选择,根据变量重要性评分挑选对旬径流影响较大的因子集;

采用bootstrap有放回抽样方法进行抽样,判断重要性的计算公式如下:VIF=∑(OBB2‑OBB1)/k      (1)其中,VIF为重要性,OBB1为利用袋内数据构建随机森林模型得到的袋外数据误差;OBB2为在袋外数据的样本中,随机改变其中的某些数据要素后,得到的袋外误差;k为随机森林决策树数量;

设定随机森林中树的数量为k,利用bootstrap有放回抽样方法随机在原始样本中抽取与原始样本容量相同的样本,重复k次,把每一次的抽样结果作为每棵决策树的输入;每棵决策树根据二叉树分类原则得到每棵树的分类结果,并对因子集进行重要性排序;删除当前高维因子集中不重要的因子,选择重要性前85%的因子集作为最后的输出;

将随机森林RF处理过的数据集分为训练集和测试集,其中训练集占总数据集的70%,测试集占总数据集的30%;

所述步骤(3)包括以下步骤:

(31)随机生成一个向量X=[xm1,xm2,...,xmn],且每个分量都在[0,1]之间;

(32)采用Circle映射得到混沌序列:

(33)将混沌序列的各个分量映射回取值范围,得到新的初始化位置公式:Fl_X(i)=lb+xmn*(ub‑lb)            (11)其中,流向周围还有c个邻域,邻域的位置公式如下:

Ne_X(j)=Fl_X(i)+rand*△           (12)其中,Ne_X(j)表示第j个邻域的位置,△若为小数字则在小范围内搜索,若为大数字则在大范围内搜索;

(34)为了确定流向的新位置,还要确定流向的流速矢量V,计算公式如下:V=randn*S                (13)式中,randn为随机数,S表示流的邻域和当前位置之间的斜率向量;

流向新位置更新公式如下:

式中Fl_newX(i)表示流向的新位置,同时模拟流向的具体计算公式如下:式中,Fl_fit(r)为随机适应度值,Fl_fit(i)为第i条流向的适应度值,Best_X为流向最好的位置,r为随机整数;

(35)使用改进后的流向算法优化CNN‑GRU模型的学习率以及隐含层节点个数,建立混合模型IFDA‑CNN‑GRU。

2.根据权利要求1所述的基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法,其特征在于,所述步骤(2)实现过程如下:卷积神经网络在卷积层通过卷积运算从输入特征图中提取数据块,然后对所有的数据块应用相同的变换,生成输出特征图,并对输出特征图进行空间重组,输出特征图中的每个空间位置都对应于输入特征图中的相同位置;卷积层公式如下:式中,Conk为卷积层输出的第k个卷积核的特征图;α为激活函数;Wtk为当前卷积层第k个卷积核的权重矩阵;Bik为当前卷积层第k个卷积核的偏置; 为卷积运算;k为卷积核的个数;

池化层对卷积层输出的信息进行降维处理,去除冗余信息的同时加快计算速度:O=max Conk      (3)

式中,O为池化层的输出;Conk为池化层的输入;

将CNN输出的数据矩阵输入GRU,GRU模型包含重置门和更新门,具体运算公式如下:at=σ(Wa·[dt‑1,xt])               (4)bt=σ(Wb·[dt‑1,xt])               (5)kt=σ(Wo·dt)                 (8)其中,kt为t时间点GRU单元的所有输出,tanh和σ分别是正切激活函数和Sigmoid激活函数,at,bt分别是t时间点重置门和更新门的计算方法,包含了当前输入xt的数据,有目的性的将 添加到当前的隐藏状态;门控信号b的范围为[0,1],b越接近1,表示“记忆”下来的信息越多,而接近0则表示“遗忘”的信息越多;(1‑bt)*dt‑1表示对原本隐藏状态的选择性“遗忘”,b可以看作遗忘门,去除dt‑1维度中某些不重要的信息; 表示对含有当前输入数据信息的 进行筛选“记忆”,对 维度中的信息进行选择。

3.根据权利要求1所述的基于随机森林和IFDA优化CNN‑GRU的中长期径流预测方法,其特征在于,所述步骤(34)包括以下步骤:(341)生成初始人口或流量,由以下矩阵表示:

(342)评估目标函数并得到最佳目标函数作为输出;

(343)设定每条流向拥有c个邻域且半径为△;

(344)通过计算每个邻域的目标函数值来确定最佳邻域;

(345)如果最佳邻域的目标函数比当前流向的目标函数更好,则应执行步骤(346),否则执行步骤(347);

(346)根据公式(13)和公式(14)更新流速以及流向的最佳邻域;

(347)根据公式(15)更新流向的位置;

(348)计算新流向的目标函数,如果它比以前的流向结果更好,则更新流向的位置;

(349)如果满足终止条件,则得到最佳结果,否则重复步骤(343)到(347)。