1.一种基于相关性增强特征学习的多标签分类方法,其特征在于,包括以下具体步骤:
S1,获取训练数据集,所述训练数据集为具有多个不同类别标签的数据集合,并将训练数据集中的数据和标签进行拆分转化,得到训练数据集对应的数据矩阵和标签矩阵,所述训练数据集包括音频数据、生物数据、图像数据和文本数据;
S2,利用训练数据集中的数据构建所述标签矩阵中与各个标签关联的训练数据子集,并构建各个所述训练数据子集的扩展数据集,所述扩展数据集表征了其中一个训练数据子集与其他训练数据子集之间的直接关系和间接关系;所述构建各个所述训练数据子集的扩展数据集具体为:通过各个标签关联的训练数据子集,计算得到两两训练数据子集对应的协方差矩阵之间的第一相似系数;
利用各个标签关联的训练数据子集,以及该训练数据子集与其他训练数据子之间的第一相似系数,构建形成各个训练数据子集对应的扩展数据集;
S3,对于每个所述扩展数据集,将所述扩展数据集输入至预置神经网络中进行处理,得到预置神经网络中每一层的输出结果,将预置神经网络的最后一层的输入确定为目标数据集,并得到所述目标数据集的协方差矩阵;
S4,通过各个所述目标数据集的协方差矩阵,计算得到两两目标数据集的协方差矩阵之间的第二相似系数,利用所述数据矩阵、所述标签矩阵和所述第二相似系数构建训练目标集合,并将所述训练目标集合输入至预置神经网络中对其进行训练;
S5,重复执行步骤S3‑S4直到达到训练结束条件,将达到训练结束条件的预置神经网络确定为多标签分类网络,将多标签待分类数据集输入至所述多标签分类网络中进行处理,得到所述多标签待分类数据的分类结果。
2.根据权利要求1所述的一种基于相关性增强特征学习的多标签分类方法,其特征在于,所述第一相似系数或所述第二相似系数通过第一公式表示,所述第一公式具体为:式中,tr(.)表示矩阵迹,||.||F表示范数,Cp表示编号为p的训练数据子集或目标数据集的协方差矩阵,Cq表示编号为q的训练数据子集或目标数据集的协方差矩阵,表示协方差矩阵Cp与协方差矩阵Cq之间的第一相似系数或第二相似系数。
3.根据权利要求1所述的一种基于相关性增强特征学习的多标签分类方法,其特征在于,所述训练结束条件为达到迭代次数或连续两次迭代的目标函数值的差值不超过阈值。
4.根据权利要求3所述的一种基于相关性增强特征学习的多标签分类方法,其特征在于,所述目标函数值具体为:式中,J(θ)表示目标函数值,表征了预置神经网络输出的标签分类结果与真实分类结果的差异,i表示训练数据子集中数据的序号,n表示训练数据子集的总数量,K表示标签类型的总数,k表示序号为i的训练数据子集的标签类型,yi表示序号为i的训练数据子集的标签内容,xi表示序号为i的训练数据子集的数据内容,P(yi,k=1|xi;θ)表示标签类型k分配给(k)数据内容xi的概率,θ 表示处理标签类型k时的训练数据子集的网络参数,λ表示比重参数,yi,k=1表示标签类型k与数据内容xi是否相关联,yi,k=1表示相关联,yi,k=0表示不关联。
5.根据权利要求4所述的一种基于相关性增强特征学习的多标签分类方法,其特征在于,所述标签类型k分配给数据内容xi的概率,具体为:(k)T
式中,P(yi,k=1|xi;θ)表示标签类型k分配给数据内容xi的概率,exp(θ xi)和exp(j)T(θ xi)表示通过Softmax函数计算的中间变量。
6.一种基于相关性增强特征学习的多标签分类系统,应用于权利要求1‑5中任一项的一种基于相关性增强特征学习的多标签分类方法,其特征在于,包括:第一模块,用于获取训练数据集,所述训练数据集为具有多个不同类别标签的数据集合,并将训练数据集中的数据和标签进行拆分转化,得到训练数据集对应的数据矩阵和标签矩阵;
第二模块,用于利用训练数据集中的数据构建所述标签矩阵中与各个标签关联的训练数据子集,并构建各个所述训练数据子集的扩展数据集,所述扩展数据集表征了其中一个训练数据子集与其他训练数据子集之间的直接关系和间接关系;所述第二模块中,包括:第一子模块,用于通过各个标签关联的训练数据子集,计算得到两两训练数据子集对应的协方差矩阵之间的第一相似系数;
第二子模块,用于利用各个标签关联的训练数据子集,以及该训练数据子集与其他训练数据子之间的第一相似系数,构建形成各个训练数据子集对应的扩展数据集;
第三模块,用于对于每个所述扩展数据集,将所述扩展数据集输入至预置神经网络中进行处理,得到预置神经网络中每一层的输出结果,将预置神经网络的最后一层的输入确定为目标数据集,并得到所述目标数据集的协方差矩阵;
第四模块,用于通过各个所述目标数据集的协方差矩阵,计算得到两两目标数据集的协方差矩阵之间的第二相似系数,利用所述数据矩阵、所述标签矩阵和所述第二相似系数构建训练目标集合,并将所述训练目标集合输入至预置神经网络中对其进行训练;
第五模块,用于重复执行步骤第三模块至第四模块直到达到训练结束条件,将达到训练结束条件的预置神经网络确定为多标签分类网络,将多标签待分类数据集输入至所述多标签分类网络中进行处理,得到所述多标签待分类数据的分类结果。
7.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现权利要求1‑5中任一项所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行权利要求1‑5中任一项所述的方法。