1.一种基于二叉树结构嵌入的可解释卷积神经网络图像分类方法,其特征在于,包括:
获取原始图像,并对所述原始图像进行预处理;
将预处理后的原始图像输入到训练后的嵌入有二叉树结构的可解释模块的卷积神经网络中;
利用卷积神经网络模型的第一卷积层提取出第一特征;
利用卷积神经网络模型的二叉树结构的可解释模块对所述第一特征进行处理,提取出第二特征和各个二叉树分支的神经元激活值,具体包括:将第一特征的各个特征图输入到二叉树结构的可解释模块中,令一侧分支神经网络解耦前一半类别的信息;另一侧分支神经网络解耦后一半类别的信息;直至最后一层分支神经网络解耦单一类别的特征信息,对各个单一类别的特征信息进行融合,得到第二特征;并计算出各个特征图在每层分支神经网络的每一侧的平均激活水平;
所述嵌入有二叉树结构的可解释模块的卷积神经网络的结构包括选取分类网络中一个卷积块作为嵌入入口,以上一个卷积块提取的特征信息作为该嵌入模块的输入,并作为下一个卷积块的输出,嵌入模块则包含多次特征图二叉树的分支,特征图二叉树分支的次数由分类任务中分类类别的数量确定;
利用卷积神经网络模型的第二卷积层对所述第一特征进行处理,提取出第三特征;
利用卷积神经网络模型的第三卷积层对所述第二特征和所述第三特征进行融合处理,提取出第四特征;
利用卷积神经网络模型的全连接层对第四特征进行分类处理,得到原始图像的分类结果;
利用各个二叉树分支的神经元激活值,得到原始图像的分类决策路径和分类可信程度,具体包括:根据第一特征的各个特征图在每侧分支神经网络的平均激活水平的相对大小,确定出原始图像的分类决策路径;结合平均激活水平的比值和分类决策路径,计算出每侧分支神经网络决策的分类可信程度,对所有分支神经网络决策的分类可信程度进行综合评价,得到原始图像的分类可信程度。
2.根据权利要求1所述的一种基于二叉树结构嵌入的可解释卷积神经网络图像分类方法,其特征在于,原始图像的分类可信程度的计算公式表示为:其中,R表示原始图像的分类可信程度,r表示第一特征的各个特征图在每侧分支神经网络决策的分类可信程度,fi1(x)表示特征图x在第i次二叉树分支时左侧分支神经网络的平均激活水平;fi2(x)表示特征图x在第i次二叉树分支时右侧分支神经网络的平均激活水平;i∈{1,2,…,N};N表示分支神经网络个数。
3.根据权利要求1所述的一种基于二叉树结构嵌入的可解释卷积神经网络图像分类方法,所述嵌入有二叉树结构的可解释模块的卷积神经网络的训练过程包括将训练图像输入到嵌入有二叉树结构的可解释模块的卷积神经网络中进行预训练,通过最小化总损失函数,得到预训练结束时,各个二叉树分支的神经元激活值以及训练图像的分类决策路径;将训练图像叠加扰动后输入到嵌入有二叉树结构的可解释模块的卷积神经网络中进行重训练,并得到重训练结束时,各个二叉树分支的神经元激活值、以及训练图像的分类决策路径;通过比较预训练和重训练过程中的相对应的神经元激活值和分类决策路径,当比较值小于预设阈值时,输出稳定后的嵌入有二叉树结构的可解释模块的卷积神经网络;否则继续利用训练图像重新进行预训练。
4.根据权利要求1或3所述的一种基于二叉树结构嵌入的可解释卷积神经网络图像分类方法,所述嵌入有二叉树结构的可解释模块的卷积神经网络的训练过程所采用的总损失函数表示为:其中,L0表示分类损失函数;λ表示平衡因子,用于平衡网络的分类性能和可解释性能;
Ji1(θ)表示第i次二叉树分支时左侧分支神经网络的损失值,Ji2(θ)表示第i次二叉树分支时右侧分支神经网络的损失值;N表示分支神经网络个数。
5.根据权利要求4所述的一种基于二叉树结构嵌入的可解释卷积神经网络图像分类方法,两侧分支神经网络的损失值分别表示为:其中,fi1(x)表示特征图x在第i次二叉树分支时左侧分支神经网络的平均激活水平;fi2(x)表示特征图x在第i次二叉树分支时右侧分支神经网络的平均激活水平;δ表示一个大于
0的常数。