利索能及
我要发布
收藏
专利号: 2021113306833
申请人: 长沙理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-03-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度相似的编辑传播方法,其特征在于,包括:

对用户交互信息进行欧氏距离变换得到距离图,其中,所述距离图用于描述图像中的各个像素点与交互点之间的距离关系;其中,对所述图像中每个目标对象区域随机选取多个交互点,不同目标对象的交互点用不同颜色进行区分,其中,将用户交互信息表示为S=t t{S|t=1,...,k},其中,S 为第t个目标对象的交互点集合;k为交互的目标对象总数目,不t t包含背景;将目标对象的用户交互S转换为欧氏距离图D,计算如下:

bg

根据这些前景的距离图计算背景的距离图D ,计算如下:

bg 1 2 k

D =255‑min(D ,D ,...,D);

t

其中,pij表示像素点的坐标;pmn∈S为交互点子集;这些生成的距离图是与输入图像同大小的二维矩阵;

使用转换的距离图和原图像作为构建好的神经网络的输入,训练网络模型,得到所述神经网络模型的模型参数;

将待处理图像和用户交互信息转换的距离图输入到训练后的所述神经网络模型中进行前馈神经网络计算得到概率图;

对所述概率图进行全局能量优化以进行编辑传播;

其中,在使用转换的距离图和原图像作为构建好的神经网络的输入,训练网络模型之前,还包括:利用多尺度特征抽取模块、目标区域定位模块和多类别分类模块构建所述神经网络模型,其中,所述神经网络模型为深度神经网络模型;所述多尺度特征抽取模块用于抽取图像的深度特征,利用多尺度特征抽取模块、目标区域定位模块和多类别分类模块构建所述神经网络模型包括:将所述图像输入到所述多尺度特征抽取模块中,得到所述多尺度特征抽取模块输出的深度特征;将所述深度特征和所述距离图通过所述目标区域定位模块进行处理,得到特征序列;使用所述多类别分类模块对所述特征序列进行动态分类;其中,所述多尺度特征抽取模块利用高分辨率网络从输入的单幅图像中抽取多尺度特征,所述网络包含四个不同分辨率的并行分支,其中每个分支由残差块组成,其中,将大小为H×W的图像I作为模块的输入,输出大小为H/4×W/4×48,H/8×W/8×96,H/16×W/16×192和H/32×W/32×384四个特征图;将其他三个分支的输出特征上采样到第一个分支的输出特征的分辨率大小,并将这些上采样的特征图与第一个分支的特征图进行级联,输出大小为H/4×W/

4×720的深度特征,记为f;所述目标区域定位模块利用计算得到的距离图进行目标区域定位,其中,所述目标区域定位模块有两个分支构成,第一个分支是由5个卷积层组成的嵌入头和3个卷积层组成的权值共享的动态融合头构成,嵌入头中第1、2和4卷积滤波器的大小为3×3,其他两层的卷积滤波器大小为1×1,步长均为1像素宽度;动态融合头中两个卷积滤波器大小为3×3,最后一层的卷积滤波器大小为1×1,步长均为1像素宽度;第二个分支由两个步长为1的3×3大小的卷积滤波器和一个1×1大小的卷积滤波器构成;所述多类别分类模块根据目标区域定位模块的输出特征进行动态分类,所述多类别分类模块由一个卷积长短时记忆单元和一个卷积滤波器大小为1×1的卷积层构成,对于目标区域i,所述多类别分类模块以特征si作为输入,输出大小为H/4×W/4×(k+1)的概率估计图。

2.根据权利要求1所述的方法,其特征在于,使用转换的距离图和原图像作为构建好的神经网络的输入,训练网络模型包括:使用PascalVOC 2012数据集中的图像以及这些图像对应的距离图作为训练数据对所述神经网络模型进行训练。

3.根据权利要求1所述的方法,其特征在于,对构建好的神经网络模型进行训练包括:

利用随机梯度下降算法进行反向传播以对所述神经网络模型进行训练。