1.引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述方法包括:获取包含多个说话者语句的对话文本构建数据集,并将所述数据集中的对话按照对应的情感类别划分成各个目标类别集合;
将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集;
基于群体情绪感染机制对所述支持集和查询集中的每个对话分别构建加权有向无环图,并提取出每个对话的引入对话语句上下文信息的语句表示;
根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型;
计算所述查询集中每个对话的引入对话语句上下文信息的语句表示分别与各个增强类原型的欧式距离,将与所述查询集中每个对话最近的增强类原型对应的原型情感类别,作为该对话的情感类别。
2.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,将所述数据集中的对话按照对应的情感类别划分成各个目标类别集合的方法包括:假设情感类别数为NC,若对话中含有至少一个语句属于情感类别k∈[1,NC],则将此对k k话标识为目标类别k,目标类别k集合表示为 其中:|D|表示目标类别集合D中k k k的对话数量,Ci∈D表示目标类别集合D中的第i个对话,D∈D,D为包含所有对话文本的数据集集合。
3.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集的方法包括:根据所有目标类别集合对话中的语句类别数量确定阈值的初始值,记为mm;
根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合;
根据G1和G2两个集合中的对话数量确定比例R,R=|G2|/(|G1|+|G2|);当满足γ1<R<γ2或者mm≤1时,分别从集合G1中采样(1‑R)*NS个对话、从集合G2中采样R*NS个对话构成支持集S,以及分别从集合G1中采样(1‑R)*NQ个对话、从集合G2中采样R*NQ个对话构成查询集Q,且 否则令mm=mm‑1,再重新执行根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合;
其中,|G1|和|G2|分别表示相应集合中的对话数量,γ1和γ2为超参数,NS和NQ为预定采样参数。
4.根据权利要求3所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述根据所有目标类别集合对话中的语句类别数量确认阈值的初始值的方法包括:对于每个所述目标类别集合,计算集合中每个对话的语句属于该集合对应的情感类别的数量,并选取其中的最大值;
从计算得到的各个目标类别集合对应的最大值中选出一个最小值作为阈值的初始值。
5.根据权利要求3所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合的方法包括:对于每个所述目标类别集合,计算集合中每个对话的语句属于该集合对应的情感类别的数量 若 则将所述对话划分到集合G1中,否则划分到集合G2中。
6.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,基于群体情绪感染机制对所述支持集和查询集中的每个对话分别构建加权有向无环图的方法包括:对所述支持集和查询集中的每个对话分别提取其语句特征;
将每个对话中的语句特征作为加权有向无环图的节点,从一个节点向另一个节点的信息传递作为加权有向无环图的边;
引入群体情绪感染机制,表现为:在所述对话中,将同一个说话者的前一个语句传递给当前语句的信息权重ω1作为所述边的值,将同一个说话者两个语句间不同说话者传递给当前语句的信息权重ω2作为所述边的值,其中ω1<ω2;若两个相邻语句间说话者为同一个人,则确定边之间的关系rij=1,否则rij=0。
7.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,提取出每个对话的引入对话语句上下文信息的语句表示的方法包括:将构建加权有向无环图时得到的参数送入用于对话情感识别的有向无环图神经网络中,提取出每个对话的引入对话语句上下文信息的语句表示;其中,所述加权有向无环图的参数包括节点、边值和边之间的关系。
8.根据权利要求7所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述有向无环图神经网络包括关系感知特征转换网络、节点信息单元和上下文信息单元,其中节点信息单元和上下文信息单元由两个门控循环单元实现;在所述有向无环图神经网络中,基于所述关系感知特征转换网络得到当前节点的聚合信息,再经过两个所述门控循环单元提取节点信息和上下文信息,将所述节点信息和上下文信息进行串联得到引入对话语句上下文信息的语句表示。
9.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型的方法包括:首先,根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的类原型,并根据各类别语句在对话中的数量占比进行加权,得到各情感类别语句的动态加权平均类原型;然后,采用平均法计算所述支持集中的每个对话中所包含各情感类别语句的增强类原型;假设情感类别为k的语句的动态加权平均类原型表示为 则所述支持集中的每个对话中含有k类别语句的增强类原型pk的计算表达式为:其中,NC*NS表示支持集中的对话数量。
10.根据权利要求9所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,情感类别为k的语句的动态加权平均类原型 的计算表达式为:其中,|Ci|表示对话中语句的数量, 表示对话Ci中语句类别为k的数量, 表示对话中语句类别为k的语句集合,vj表示对话中提取的第j个引入对话语句上下文信息的语句表示。