1.一种多标签文本分类方法,其特征是,包括以下步骤:获取包含文本序列和标签空间的训练集,采用长短时记忆网络提取文本序列中所有单词的全局特征向量,采用卷积神经网络对得到的全局特征向量进行聚合,得到文本序列中每个单词的语义向量;所述采用长短时记忆网络提取文本序列中所有单词的全局特征向量的步骤包括:采用长短时记忆网络提取文本序列中每个单词在两个方向上的隐藏向量;分别将每个单词在两个方向上的隐藏向量连接起来,得到每个单词向量的全局特征向量;
分别计算标签空间中每个标签与文本序列中所有单词的余弦相似度,并将其作为权重系数,构建注意力权重系数矩阵,对注意力权重系数矩阵进行处理,得到最优权重系数矩阵;分别将每个单词的语义向量与最优权重系数矩阵中权重系数向量进行加权,得到标签的注意力向量;所述对注意力权重系数矩阵进行处理的步骤包括:对注意力权重系数矩阵进行动态最大池化处理,并利用归一化函数对动态最大池化处理后的权重系数矩阵中权重系数向量进行归一化处理,得到最优权重系数矩阵;
对所有标签的注意力向量进行归一化处理,得到每个标签的概率,选取几个概率最大的标签对文本进行分类;
所述采用卷积神经网络对得到的全局特征向量进行聚合的方法为:对卷积神经网络进行训练,学习到卷积神经网络的权值参数和偏置参数;利用训练后的卷积神经网络对全局特征向量H进行聚合,得到文本序列中所有单词的语义向量V,具体的:V=conv(W1,H)+b1
其中,W1和b1分别是权值参数和偏置参数,通过训练集中数据训练卷积神经网络CNN可以学习到权值参数和偏置参数。
2.根据权利要求1所述的多标签文本分类方法,其特征是,所述文本序列包含若干个单词,所述标签空间包含多个标签,每个单词和标签分别用词向量表示。
3.根据权利要求1所述的多标签文本分类方法,其特征是,所述注意力权重系数矩阵的构建方法为:
分别计算标签空间中每个标签与文本序列中每个单词的相似度向量,并构建相似度矩阵;
利用非线性激活函数去除相似度矩阵中余弦相似度小于零的向量,得到注意力权重系数矩阵。
4.根据权利要求1所述的多标签文本分类方法,其特征是,得到标签的注意力向量后,还利用全线性连接层对标签的注意力向量进行线性处理。
5.一种多标签文本分类系统,其特征是,包括:编码模块,用于获取包含文本序列和标签空间的训练集,采用长短时记忆网络提取文本序列中所有单词的全局特征向量,采用卷积神经网络对得到的全局特征向量进行聚合,得到文本序列中每个单词的语义向量;所述采用长短时记忆网络提取文本序列中所有单词的全局特征向量的步骤包括:采用长短时记忆网络提取文本序列中每个单词在两个方向上的隐藏向量;分别将每个单词在两个方向上的隐藏向量连接起来,得到每个单词向量的全局特征向量;
解码模块,用于分别计算标签空间中每个标签与文本序列中所有单词的余弦相似度,并将其作为权重系数,构建注意力权重系数矩阵,对注意力权重系数矩阵进行处理,得到最优权重系数矩阵;分别将每个单词的语义向量与最优权重系数矩阵中权重系数向量进行加权,得到标签的注意力向量;所述对注意力权重系数矩阵进行处理的步骤包括:对注意力权重系数矩阵进行动态最大池化处理,并利用归一化函数对动态最大池化处理后的权重系数矩阵中权重系数向量进行归一化处理,得到最优权重系数矩阵;
分类模块,用于对所有标签的注意力向量进行归一化处理,得到每个标签的概率,选取几个概率最大的标签对文本进行分类;
所述采用卷积神经网络对得到的全局特征向量进行聚合的方法为:对卷积神经网络进行训练,学习到卷积神经网络的权值参数和偏置参数;利用训练后的卷积神经网络对全局特征向量H进行聚合,得到文本序列中所有单词的语义向量V,具体的:V=conv(W1,H)+b1
其中,W1和b1分别是权值参数和偏置参数,通过训练集中数据训练卷积神经网络CNN可以学习到权值参数和偏置参数。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时实现如权利要求1‑4中任一项所述的多标签文本分类方法中的步骤。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如权利要求1‑4中任一项所述的多标签文本分类方法中的步骤。