利索能及
我要发布
收藏
专利号: 2022104248903
申请人: 广东石油化工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-15
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种信息识别方法,其特征在于,学习阶段包括以下步骤:步骤S11,将包含多个样本类别、多个样本域的训练样本集S划分为模拟训练样本集DS和模拟测试样本集DT;

s s

步骤S12,将所述模拟训练样本集DS的各个类别c的样本数据xc、所述样本数据xc的类s s别标签yc输入编码器网络,所述编码器网络生成所述样本数据xc的各个类别c在潜在空间的第一分布;

t

步骤S13,将所述模拟测试样本集DT的样本数据x 输入先验网络,所述先验网络生成所t述样本数据x在所述潜在空间的第二分布;

步骤S14,计算各个类别c的所述第一分布之和与所述第二分布之间的KL距离,使该KL距离最小。

2.根据权利要求1所述的信息识别方法,其特征在于,还包括:t

步骤S15,将所述模拟测试样本集DT的样本数据x以及所述第一分布的参数输入解码器t网络,所述解码器网络基于所述模拟测试样本集DT的样本数据x以及所述第一分布的参t数,生成所述样本数据x的预测类别标签t t

使所述预测类别标签 与所述样本数据x的已知类别标签y的交叉熵最小。

3.根据权利要求2所述的信息识别方法,其特征在于,测试阶段包括以下步骤:步骤S31,将测试样本集T的测试样本数据x输入所述先验网络,所述先验网络生成所述测试样本数据x在潜在空间的第三分布;

步骤S32,将所述测试样本数据x和所述第三分布的参数输入所述解码器网络,所述解码器网络根据所述第三分布的参数生成所述测试样本数据x的预测类别标签

4.根据权利要求3所述的信息识别方法,其特征在于,s

步骤S12中,不同类别的所述样本数据xc的所述第一分布之间的Wasserstein距离LW最大。

5.根据权利要求1所述的信息识别方法,其特征在于,步骤S11中,在所述训练样本集S的多个样本域中,随机选择一个样本域作为所述模拟测试样本集DT,其余的样本域作为所述模拟训练样本集DS。

6.根据权利要求2所述的信息识别方法,其特征在于,l t

步骤S15中,对所述第一分布进行多次采样,将多个采样值z以及所述样本数据x输入所述解码器网络,得到多个预测类别标签,对该多个预测类别标签取平均,将得到的平均值t作为所述样本数据x的预测类别标签

7.根据权利要求4所述的信息识别方法,其特征在于,计算整体损失函数 如式(1):

其中, 为交叉熵,DKL为KL距离, 为Wasserstein距离,根据式(2),利用梯度下降法更新所述编码器网络、所述先验网络、所述解码器网络的参数:

8.根据权利要求3所述的信息识别方法,其特征在于,l

步骤S32中,对所述第三分布进行多次采样,将多个采样值z以及所述样本数据x输入所述解码器网络,得到多个预测类别标签,对该多个预测类别标签取平均,将得到的平均值作为所述样本数据x的预测类别标签

9.根据权利要求1‑8中任一项所述的信息识别方法,其特征在于,所述训练样本集S、测试样本集T的样本数据为图形数据、语音数据、或文字数据。

10.一种信息识别系统,其特征在于,包括:编码网络单元,在学习阶段,其接收从训练样本集S划分出的模拟训练样本集DS的各个s s s s类别c的样本数据xc、以及所述样本数据xc的类别标签yc,生成所述样本数据xc的各个类别c在潜在空间的第一分布,其中,所述训练样本集S包含多个样本类别、多个样本域,所述训练样本集S划分为所述模拟训练样本集DS和模拟测试样本集DT;

t

先验网络单元,在学习阶段,其接收所述模拟测试样本集DT的样本数据x ,并生成所述t样本数据x 在潜在空间的第二分布,其中,各个类别c的所述第一分布之和与所述第二分布之间的所述KL距离最小;

t

解码器网络单元,在学习阶段,其接收所述模拟测试样本集DT的的样本数据x以及所述t第一分布的参数,生成所述样本数据x的预测类别标签 其中,所述预测类别标签 与所t t述样本数据x的已知类别标签y的交叉熵最小。

11.如权利要求10所述的信息识别系统,其特征在于,在测试阶段,

所述先验网络单元接收所述测试样本集T的所述测试样本数据x生成基于所述测试样本数据x的第三分布;

所述解码器网络单元接收所述测试样本数据x和所述第三分布的参数,生成所述测试样本数据x的所述预测类别标签

12.根据权利要求10所述的信息识别系统,其特征在于,s

所述编码网络单元输出的不同类别的所述样本数据xc 的所述第一分布之间的Wasserstein距离LW最大。

13.一种电子设备,其特征在于,包括一个或多个处理器及存储器,所述存储器上存储有一个或多个计算机程序,当所述一个或多个处理器执行所述一个或多个计算机程序时,实现权利要求1‑9中任一项所述的信息识别方法步骤。

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序程序被处理器运行时实现权利要求1‑9中任一项所述的信息识别方法。