利索能及
我要发布
收藏
专利号: 2017114059729
申请人: 东软集团股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-03
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于卷积神经网络的语句情感分类方法,其特征在于,包括:对输入语句进行切分处理生成M个字词切分单元,将每个字词切分单元进行编码转化成预设长度的词向量;

将与所述M个字词切分单元对应的词向量进行结构转化生成原始矩阵;

将所述原始矩阵输入预先训练的卷积神经网络,通过串行的N组卷积层和池化层对所述原始矩阵进行计算,其中,N为大于等于1的整数,将每个池化层计算后的输出特征和所述原始矩阵分别输入到每个池化层各自对应的第一全连层进行计算,将所有所述第一全连层计算后的输出特征进行拼接融合后输入到第二全连层,将所述第二全连层计算后的输出特征输入到分类层获取对所述输入语句的情感分类结果;

其中,所述N个卷积层中的第2个卷积层至第N个卷积层中的每个卷积层的输入为上一池化层的输出。

2.如权利要求1所述的方法,其特征在于,所述对输入语句进行切分处理生成M个字词切分单元,将每个字词切分单元进行编码转化成预设长度的词向量,包括:检测所述输入语句的长度;

若检测获知所述长度大于预设的第一阈值或者小于预设的第二阈值,则对所述输入语句进行剪切或者填充处理,其中,所述第二阈值小于所述第一阈值;

对长度调整后的输入语句进行切分处理生成M个字词切分单元,将每个字词切分单元进行word2vec编码转化成预设长度的词向量。

3.如权利要求1所述的方法,其特征在于,所述将与所述M个字词切分单元对应的词向量进行结构转化生成原始矩阵,包括:对每个词向量的每一位值进行竖向排列,再对所述M个竖向排列的词向量进行横向拼接生成原始矩阵;

根据所述卷积神经网络的训练矩阵尺寸对所述原始矩阵进行插值和抽取操作。

4.如权利要求1所述的方法,其特征在于,还包括:采集多个样本语句以及对应的情感标签生成训练样本集;

通过向前传播阶段和向后传播阶段训练所述卷积神经网络的网络参数。

5.如权利要求4所述的方法,其特征在于,还包括:根据所述多个样本语句的平均长度确定所述卷积神经网络中卷积层和池化层的N值。

6.一种基于卷积神经网络的语句情感分类装置,其特征在于,包括:切分转化模块,用于对输入语句进行切分处理生成M个字词切分单元,将每个字词切分单元进行编码转化成预设长度的词向量;

生成模块,用于将与所述M个字词切分单元对应的词向量进行结构转化生成原始矩阵;

处理模块,用于将所述原始矩阵输入预先训练的卷积神经网络,通过串行的N组卷积层和池化层对所述原始矩阵进行计算,其中,N为大于等于1的整数,将每个池化层计算后的输出特征和所述原始矩阵分别输入到每个池化层各自对应的第一全连层进行计算,将所有所述第一全连层计算后的输出特征进行拼接融合后输入到第二全连层,将所述第二全连层计算后的输出特征输入到分类层获取对所述输入语句的情感分类结果;

其中,所述N个卷积层中的第2个卷积层至第N个卷积层中的每个卷积层的输入为上一池化层的输出。

7.如权利要求6所述的装置,其特征在于,还包括:采集模块,用于采集多个样本语句以及对应的情感标签生成训练样本集;

训练模块,用于通过向前传播阶段和向后传播阶段训练所述卷积神经网络的网络参数。

8.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1‑5中任一所述的基于卷积神经网络的语句情感分类方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一所述的基于卷积神经网络的语句情感分类方法。