利索能及
我要发布
收藏
专利号: 2025101124086
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种医学图像的可聚合因果信息提取方法,其特征在于,所述方法包括:构建因果表示学习框架;其中,所述因果表示学习框架包括编码器、结构因果模型、解码器和判别器,所述编码器用于将输入的医学图像编码为低维的外生变量,所述结构因果模型以所述低维的外生变量作为输入,并基于所述低维的外生变量生成因果表示,所述解码器用于干预并重构因果表示,所述判别器用于对抗性训练;

建立模型训练损失函数,基于所述模型训练损失函数对所述因果表示学习框架进行训练,以训练后的因果表示学习框架实现医学图像中的可聚合因果信息提取;

所述结构因果模型表示为:

式中,z表示因果表示,T表示矩阵转置,f和h表示非线性函数,g表示参数化的图注意力网络, 表示低维的外生变量,表示实数域,d表示因果属性的数量,A表示先验因果图, 表示因果结构矩阵;

基于梯度的连续更新策略优化图注意力网络,以获得因果结构矩阵 将所述因果结构矩阵 输入至结构因果模型中,生成因果表示。

2.根据权利要求1所述的医学图像的可聚合因果信息提取方法,其特征在于,基于梯度的连续更新策略优化图注意力网络,以获得因果结构矩阵 包括:以i和j作为因果结构矩阵 中的任意两个节点,通过将连接特征与共享注意力机制a(·)相乘来学习i和j之间的因果边,生成注意力分数eij;所述注意力分数表示为:eij=a(Wi∈,Wj)

式中, 表示一个共享的权重矩阵;

对于节点i,只计算节点j∈Pai,其中Pai表示父节点,使用softmax函数对它们进行归一化,计算过程如下:式中, 表示由第h个注意力头生成的归一化注意力系数,H表示注意力头的数量;

通过如下公式构建

式中, 表示因果结构矩阵中i行j列的因果强度,τ>0,是控制结果接近0或1的温度参数;g1和g0表示独立从Gumbel(0,1)分布中抽取的样本,σ(·)表示逻辑sigmoid函数;

迭代训练图注意力网络,获得因果结构矩阵

3.根据权利要求1所述的医学图像的可聚合因果信息提取方法,其特征在于,将所述因果结构矩阵 输入至结构因果模型中,生成因果表示,包括:利用基于度量学习的编码器生成三元组样本的理想的因果表示;三元组网络通过测量锚点与正/负样本之间的距离,在潜空间内拟合特征分布,从而获取不受分布转移影响的因果表示,三元组损失表示为:式中,(za,zp,zn)表示三元组,包括一个锚点样本za、一个正样本zp和一个负样本zn,max表示最大值函数,D(za,zn)表示锚点样本与负样本之间的距离,D(za,zp)表示锚点样本与正样本之间的距离,D(zi,zj)=||f(zi)‑f(zj)||2表示两个向量之间的欧几里得距离,m表示边际。

4.根据权利要求1所述的医学图像的可聚合因果信息提取方法,其特征在于,通过如下公式干预并重构因果表示:‑1

式中,f 表示干预后f的逆映射, 表示一组干预操作, 表示干预后的因果表示,表示干预后的因果结构矩阵。

5.根据权利要求1所述的医学图像的可聚合因果信息提取方法,其特征在于,通过如下方法建立模型训练损失函数;

通过学习因果表示z的真实分布p的近似变分分布q,以拟合实际的后验分布;

获取训练数据集 和联合分布 最大化证据下界,所述证据下界表示为:式中,ELBO表示证据下界; 表示在数据分布 下对所有样本取期望,确保模型的目标函数优化能够反映数据集整体的表现; 表示在隐变量z的近似后验分布qφ(z|x,u)下计算的期望值;pθ(x|z)表示从潜变量生成观测数据的分布,参数化为θ;qφ(∈|x,u)表示给定观测数据x和条件变量u下,∈的概率分布;p∈(∈)表示噪声变量∈的先验分布;qφ(z|x,u)表示潜在变量z的近似后验分布;pθ(z|u)表示潜在变量z的先验分布;

和 表示KL散度项,分别衡量了使用||

分隔的两个分布的差异;x表示高维医学图像数据;u表示图像的对应标签;

通过在由结构因果模型生成的表示上设置设置先验并计算KL散度来实现模型学习因果结构,使用以下损失函数:其中

式中,α和β是正则化超参数, 表示重建能力的期望对数似然, 表示通过先验知识约束潜变量的分布; 表示通过优化潜空间中特征的距离; 表示VAE框架的整体损失函数;DKL(qφ(∈|x,u)‖p∈(∈))表示qφ(∈|x,u)和qφ(∈|x,u)的KL散度,其中qφ(∈|x,u)是对隐含变量∈的后验分布建模的变分近似,p∈(∈)是外生变量∈的先验分布;DKL(qφ(z|x,u)||pθ(z|u))表示分布qφ(z|x,u)和pθ(z|u)之间的KL散度,其中qφ(z|x,u)是VAE中编码器网络学习到的近似后验分布,表示在给定观测数据x和条件u时,隐变量z的概率分布;xa表示锚点样本;xp表示在语义上与锚点样本接近的样本,即正样本;xn表示在语义上与锚点样本相差较大的样本,即负样本;m表示边际;D(xa,xp)表示锚点样本与正样本在特征空间中的距离,使用欧氏距离计算;D(xa,xn)表示锚点样本与负样本在特征空间中的距离;

判别器使用以下损失函数优化一个二元分类器:

式中, 表示判别器损失;Dis(x)表示判别器的输出,取值范围为0≤Dis(x)≤1,表示由解码器生成的数据;

将模型训练损失函数 表示为:

6.一种医学图像的可聚合因果信息提取装置,其特征在于,所述装置包括:框架构建模块,被配置为构建因果表示学习框架;其中,所述因果表示学习框架包括编码器、结构因果模型、解码器和判别器,所述编码器用于将输入的医学图像编码为低维的外生变量,所述结构因果模型以所述低维的外生变量作为输入,并基于所述低维的外生变量生成因果表示,所述解码器用于干预并重构因果表示,所述判别器用于对抗性训练;

框架训练模块,被配置为建立模型训练损失函数,基于所述模型训练损失函数对所述因果表示学习框架进行训练,以训练后的因果表示学习框架实现医学图像中的可聚合因果信息提取;

所述结构因果模型表示为:

式中,z表示因果表示,T表示矩阵转置,f和h表示非线性函数,g表示参数化的图注意力网络, 表示低维的外生变量, 表示实数域,d表示因果属性的数量,A表示先验因果图, 表示因果结构矩阵;

基于梯度的连续更新策略优化图注意力网络,以获得因果结构矩阵

将所述因果结构矩阵 输入至结构因果模型中,生成因果表示。

7.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

所述存储器存储计算机执行指令;

所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1‑5中任一项所述的医学图像的可聚合因果信息提取方法。

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1‑5中任一项所述的医学图像的可聚合因果信息提取方法。

9.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如权利要求1‑5中任一项所述的医学图像的可聚合因果信息提取方法。