利索能及
我要发布
收藏
专利号: 2024100546635
申请人: 中国矿业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤如下:S1、加载不平衡数据类,样本数量为N,类别为M,识别数据集标签列,将其转化为0‑1标签矩阵T,并将不平衡数据类划分为训练集和测试集;

S2、根据样本权重Dm训练第m个弱学习器BLm;

S3、由约束公式计算监督指标并添加最佳节点;

*

S4、计算输出权重β得到网络输出;

S5、更新网络残差,评估当前建模情况;

S6、更新目标函数,计算并判断模型的loss是否小于给定的容差ε,若小于给定的容差ε,则整体建模过程结束并更新样本权重,否则进入步骤S7;

S7、计算当前样本权重的计算分类误差率。

2.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤S2中,根据样本权重Dm训练第m个弱学习器BLm具体为:S21、建立第m个弱学习器BLm的L‑1层隐藏节点的网络,则第m个弱学习器BLm的网络输出表示为:T T

式中wj=[wj1,....,wjd] ,bj=[bj1,...,bjd]分别为隐含层节点的输入权重和偏置,βjT=[βj1,...,βjm] 为隐藏层与输出层之间的输出权重,gj代表激活函数,此处为sigmoid激活函数;

S22、将步骤S21中的网络输出经过SoftMax层处理,即设定其输出的每个类别概率分布预测值和严格为

1,且不存在超过1的概率和负值概率,则经过SoftMax层处理后的网络输出表示为:式中各参数含义与式(1)相同。

3.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤S3中,由约束公式计算监督指标并添加最佳节点,具体为:从可调区间中随机生成输入权重wL和偏置bL,并计算监督指标:其中, ||·||表示

Frobenius范数,此时,eL‑1,q代表建模第L‑1个节点时,输出所对应的网络残差,r为缩放因子,uL小于等于(1‑r);根据从候选节点池中将监督指标ξL取得最大值时的隐藏节点更新到网络中。

4.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其*特征在于,步骤S4中,计算输出权重β得到网络输出,具体为:根据约束不等式挑选出的最佳节点,使用最小二乘法计算输出权重:其中,H为隐藏层输出,T为标签矩阵:T

HH 代表非奇异矩阵,

T

H=[H1,H2,...,HL]。

5.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤S5中,更新网络残差,评估当前建模情况,具体为:S51、根据式(2)的网络输出表达式,采用交叉熵更新网络残差eL‑1,更新后的网络残差表达式为:S52、根据步骤S51中更新后的网络残差,采用交叉熵损失来评估当前阶段建模情况,交叉熵损失的计算公式为:

6.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤S6中,更新目标函数:计算模型 的loss,若小于给定的容差ε,则整体建模过程结束,否则进入步骤S7,其中,BL代表基学习器,v代表基学习器在最后输出中所占比重。

7.根据权利要求1所述的一种基于多类别指数损失函数的不平衡数据软分类方法,其特征在于,步骤S7中,若模型当前loss大于给定的容差ε,则通过监督指标BLm添加节点,并计算当前样本权重下BLm的分类误差率errorm,分类误差率计算公式如下:若errorm‑1>errorm,则停止继续在第m个模型上添加节点,保存第m个模型的参数,根据当前样本权重计算出的errorm,为第m个模型分配权重vm:其中K表示样本的类别个数;

更新样本权重Dm+1:

令m=m+1,Dm=Dm+1,

则第m+1个模型基于 继续建模;

若errorm‑1<errorm,返回步骤S3继续寻找并节点并更新,直到整体满足预设误差,建模过程结束。