1.一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:包括以下步骤,步骤(A),推导出皮尔森相关系数计算公式,其具体步骤如下,步骤(A1),皮尔森相关系数由计算两个变量X,Y的标准差与协方差的商得到总体相关系数ρx,y,如公式(1)所示,步骤(A2),计算样本点的协方差和标准差,可得到皮尔森相关系数r,如公式(2)所示,其中,是Xi的样本均值,是Yi的样本均值;
步骤(A3),计算样本点的标准分数均值,可得到与公式(2)等价的表达式,如公式(3)所示,其中, 是Xi的标准分数,σx是Xi的样本标准差; 是Yi的标准分数,σy是Yi的样本标准差;
步骤(B),推导出斯皮尔曼相关系数计算公式;
步骤(C),求得出斯皮尔曼相关系数的优势;
步骤(D),对数据进行特征选择,其中特征选择包括单变量特征选择、计算皮尔森相关系数、计算互信息和最大信息系数、设定距离相关系数和基于模型的特征排序,具体步骤如下,步骤(D1),单变量特征选择,单独的计算每个特征的全局指标,其使用包含transform函数的对象实现特征选择程序,transform函数的对象包括SelectKBest、SelectPercentile、SelectFpr、SelectFdr和SelectFwe;
其中,transform函数的定义是将操作应用于指定范围的每个元素,SelectKBest表示得到得分前k名的所有特征、SelectPercentile表示得到得分前百分比以内的所有特征、SelectFpr表示假正率、SelectFdr表示伪发现率和SelectFwe表示族系误差率;
步骤(D2),计算皮尔森相关系数,其计算公式采用的是公式(3);
步骤(D3),计算互信息和最大信息系数,互信息是评价定性自变量对定性因变量的相关,I(X;Y)为单个事件之间互信息的数学期望,互信息计算公式如公式(9)所示,其中,最大信息系数是将互信息转化为度量方式,并将互信息的取值范围设为[0,1];
步骤(D4),设定距离相关系数,设定的距离相关系数的定义是只要距离相关系数是0,那这两个变量一定是独立的;
步骤(D5),基于模型的特征排序,基于模型的特征排序是使用调参优化的机器学习算法,且在每个特征和因变量之间建立预测模型,并通过建立完的预测模型对每个特征进行打分;
步骤(E),构建感知机;
步骤(F),引入多层神经网络;
步骤(G),依据神经网络设计反向传播算法进行预测,并产生预测结果。
2.根据权利要求1所述的一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:步骤(B),推导出斯皮尔曼相关系数计算公式,斯皮尔曼相关系数通过单调函数来表示变量间的相关性,相关性以ρ表示,具体步骤如下,步骤(B1),设存在两个变量分别为X、Y,元素个数均为N,两个变量的第i个元素分别用Xi、Yi表示;X、Y的排序集合为x、y,元素xi、yi分别为Xi在X中的排名以及Yi在Y中的排名;xi与yi对应相减得到一个排序差分集合d;变量X、Y之间的斯皮尔曼等级相关系数的计算如公式(4)所示,步骤(B2),再由排序集合x、y计算而得公式(5),
3.根据权利要求2所述的一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:步骤(C),求得出斯皮尔曼相关系数的优势,其具体方法有两种一种是分层排列测试检验,另一种是在皮尔森积矩中使用费雪交换,具体步骤如下步骤(C1),分层排列测试检验,对于被观测数据的ρ值,设ρ不为零,并计算它大于r的概率,且r范围是1≥r≥‑1,使用分层排列测试检验;
步骤(C2),在皮尔森积矩中使用费雪交换,具体步骤如下,
步骤(C21),通过费雪变换获得ρ的置信区间和零检验,如公式(6)所示,步骤(C22),设F(r)中r是Fisher变换,则如公式(7)所示,其中,z是零检验,n为自由度;
步骤(C23),r服从并依赖在零假设下的标准正态分布,显著性t如公式(8)所示,
4.根据权利要求3所述的一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:步骤(E),构建感知机,感知机由两层神经元组成,分为输入层和输出层,其中输入层接收外界输入信号后传递给输出层,输出层是M‑P神经元,其数学表达式如公式(10)所示,其中,y表示为输出、w表示为权重和x表示为输入。
5.根据权利要求4所述的一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:步骤(F),引入多层神经网络,其中神经网络结构被称为多层前馈神经网络,而多层神经网络包含一个层次化的、前向反馈的和全连接的人工神经元或节点的网络,网络的前向反馈特性限制网络只能向单一方向流动并且不允许循环,其中多层神经网络输入节点的数量等于数据集中属性类型的数量,输出层的节点等于要解决的分类任务。
6.根据权利要求5所述的一种基于神经网络的太阳耀斑二分类预测方法,其特征在于:步骤(G),依据神经网络设计反向传播算法进行预测,并产生预测结果,其中反向传播算法是获取特定记录的预测误差并将该误差通过网络反向传播,并分配划分的误差响应到各个类连接上,且误差为实际值减去输出值,而神经网络设计反向传播算法是利用Sigmoid激活函数和梯度下降,并提出了一种如下的反向传播规则,如公式(11)和公式(12)所示,wij.new=wij.current+Δwij (11)Δwij=ηδjxij (12)其中,η表示学习率,xij表示节点j的第i个输入,δj表示属于节点j的特定误差的响应能力,且误差响应能力是由关于节点j的Sigmoid函数的偏导数计算获得。