1.一种在特征选择与聚类分析后的混合神经网络模型天气分类方法,其特征在于,该方法包括以下步骤:步骤1)建立气象观测要素数据集,两两计算天气数据特征之间的MIC最大信息系数,并根据求得的MIC最大信息系数矩阵对天气特征进行筛选得到相关的天气特征数据集;
步骤2)对天气特征数据集进行聚类分析,使用贝叶斯信息准则估计最佳的类簇数,根据估计的类簇数对数据集进行高斯混合模型聚类得到天气样本类簇集合;
步骤3)搭建MLP多层感知机模型和MLNN形态学‑线性神经网络模型,并对其中的超参数进行设置;
步骤4)使用天气样本类簇集合根据AdaBoost自适应加强算法对步骤3)中的模型进行顺序训练,同时得到混合权重,对两个模型预测的天气种类的概率进行加权混合,最终得到天气种类。
2.根据权利要求1所述的一种在特征选择与聚类分析后的混合神经网络模型天气分类方法,其特征在于,步骤1的具体方法如下:步骤1.1:建立预处理标准化后的平均气压、日最高温度、日最低温度、日平均相对湿度、风速、总云量、日平均空气质量指数以及日照时间共8个气象观测要素的数据集以及当时天气的类型结果集 其中,x表示气象要素值,{1,...,n}表示天气特征的序号,n表示天气事实样本的数量,8表示气象特征数量,y表示每个气象数据样本采集当天的天气类型数据;
步骤1.2:两两计算天气数据特征之间的MIC最大信息系数,每一组特征对
公式(2)中,mic(xj,xk)表示特征变量xj和xk之间最大信息系数,将变量(xj,xk)视作散点投射到二维空间中制作成使用散点图,a,b分别是在xj和xk方向上的划分区域的个数,B是
0.6
参数变量,大小设置为样本量n的0.6次方,即n ;
最终计算得出特征之间的MIC最大信息系数矩阵 mjk表示特征
xj和xk之间的MIC最大信息系数,指示这两个特征之间的相关性;
步骤1.3:通过步骤1.2中求得的MIC最大信息系数矩阵,对气象数据集的特征进行选择,保留气象数据集中MIC最大信息系数大于0.5相关的特征,即若mjk≤0.5,则去除特征xj和xk,最终得到筛选后的数据集 及其结果集合 g表示筛选后保留的特征的总个数。
3.根据权利要求2所述的一种在特征选择与聚类分析后的混合神经网络模型天气分类方法,其特征在于,步骤2的具体方法如下:步骤2.1:在对筛选后的气象数据集进行聚类分析之前,首先使用贝叶斯信息准则BIC+估计最佳的聚类模型集群数t,其中,t∈{t|0<t≤10,t∈N},对每一个t值计算它的BIC估计值,公式如下:公式(3)其中,n为特征数据集中的样本数,d为模型学习到的参数,是模型的似然函数的最大值,选择BIC估计值最低时的t值作为聚类的类簇数;
步骤2.2:使用步骤2.1中得出的聚类模型集群数t作为高斯混合模型的聚类超参数,对筛选后的数据集 进行聚类分析得到聚类后的样本集群D={s1,s2,...st},其中,sj表示不同的类簇,一共t个类簇,每个类簇中含有若干天气数据样本。
4.根据权利要求3所述的一种在特征选择与聚类分析后的混合神经网络模型天气分类方法,其特征在于,步骤3的方法具体如下:步骤3.1:搭建一个MLP分类神经网络,其中输入层神经元个数为输入特征个数g,隐藏层数为5,每个隐藏层的神经元个数为50,学习率设置为0.1,输出层激活函数为soft max激活函数,输出层神经元个数为天气种类数h,并在输入神经元和隐藏层神经元中加入概率为p=0.3的辍学训练,最终输出预测的天气种类的概率 其中,fj表示该样本数据的天气种类是第j种的概率;
步骤3.2:搭建一个MLNN分类神经网络,其中输入层神经元个数为输入特征个数g,隐藏层数为1,由150个形态学‑线性神经元组成,学习率设置为0.05,输出层激活函数为soft max激活函数,输出层神经元个数为天气种类数h,并在输入神经元和隐藏层神经元中加入概率为p=0.3的辍学训练,最终输出预测的天气种类的概率 其中,fj表示该样本数据的天气种类是第j种的概率。
5.根据权利要求4所述的一种在特征选择与聚类分析后的混合神经网络模型天气分类方法,其特征在于,步骤4的方法具体如下:步骤4.1:运用集成学习的思想使用AdaBoost自适应加强算法,使用步骤2.2中聚类结果D={s1,s2,...st}根据不同类簇对在步骤3.1和步骤3.2中搭建的神经网络进行顺序训练,AdaBoost自适应加强算法如下:计算第k个分类器Gk(x)在训练中的加权误差率ek,公式如下:
通过加权误差率ek计算第k个分类器Gk(x)的权重系数αk,公式如下:公式(4)中,K表示分类器个数,K取值为2,Gk(x)表示第k个分类器,k的取值集合为{1,
2},n表示训练集的样本个数,i表示第i个训练样本,wki表示第k个训练器对第i个训练样本的训练权重,每一个训练样本最开始时都被赋予相同的权值,即 yi表示第i个训练样本的结果,I(Gk(xi)≠yi)表示对分类器结果Gk(xi)和训练样本的结果yi是否不同的判断,当Gk(xi)≠yi时,I(Gk(xi)≠yi)的值为1,反之为0;
首先训练MLP多层感知机,再通过训练结果强化训练集,然后训练MLNN形态学‑线性神经网络,并计算两个模型的混合权重αk,最终得到训练完成的MLP多层感知机模型G1(x)和MLNN形态学‑线性神经网络模型G2(x)以及各自的混合权重α1和α2;
步骤4.2:根据步骤4.1中求得的单个分类器权重αk,对两个已经训练完成的分类器Gk(x)进行集成混合,混合公式如下:F混=a1F1+a2F2 (6)
公式(6)中,α1和α2为步骤4.1中计算得到的模型混合权重,F1和F2表示两个模型的预测结果,最终混合结果为 其中,fk表示该样本数据的天气种类是第k种的概率,选取中概率最高的天气种类作为最终混合模型预测的天气种类。