利索能及
我要发布
收藏
专利号: 2017111675856
申请人: 长沙理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图像颜色编辑方法,其特征在于,包括:

S1,基于不同类别的用户交互信息,提取待编辑图像上不同类别的像素以构成不同类别的种子像素集,并根据所述待编辑图像上每一像素与每一类别的种子像素集中每一种子像素之间的空间距离,确定每一类别的种子像素集对应的所述待编辑图像的距离图;

S2,将每一个所述距离图作为所述待编辑图像的一个新的通道图,并结合所述待编辑图像的RGB三个通道图,确定所述待编辑图像的多通道图像,并从所述多通道图像中预设位置处提取预设数量的多通道图像子块,所述预设位置为所述多通道图像中与每一类别的用户交互信息对应的位置;

S3,基于训练好的多特征联合网络模型,提取每一多通道图像子块中的深度特征,根据所述深度特征,得到所述待编辑图像中每一像素所属类别的概率;

S4,根据得到的所述待编辑图像中每一像素所属类别的概率以及最小化的图像分割能量函数,确定所述待编辑图像中每一像素所属类别,并根据所述待编辑图像中每一像素所属类别,对所述待编辑图像的颜色进行编辑。

2.根据权利要求1所述的方法,其特征在于,所述从所述多通道图像中预设位置处提取预设数量的多通道图像子块,具体包括:从所述多通道图像的每一个通道图中所述预设位置处选取预设数量组像素点,每组像素点构成一个图像子块,所有通道图中相同位置处的图像子块构成一个多通道图像子块。

3.根据权利要求1所述的方法,其特征在于,所述多特征联合网络模型具体包括:深度特征抽取层、全连接层和概率估计层;

所述深度特征抽取层用于提取所述多通道图像子块中的深度特征;所述全连接层用于将提取到的深度特征进行全连接;所述概率估计层,用于根据全连接后的深度特征,采用soft-max函数得到所述待编辑图像中每一像素所属类别的概率。

4.根据权利要求3所述的方法,其特征在于,每一类别对应唯一的类别标签值,所述多特征联合网络模型通过如下方法进行训练以确定模型参数:将所述预设数量的多通道图像子块中每一多通道图像子块以及所述每一多通道图像子块对应的类别标签值作为一个训练样本,根据所有训练样本对所述多特征联合网络模型进行训练;

基于随机梯度下降算法,当训练次数达到所述预设数量时,或者所述多特征联合网络模型的模型参数使所述多特征联合网络模型的损失函数收敛时,则结束训练;

所述损失函数用于基于所述待编辑图像中每一像素所属类别的概率,度量所述每一多通道图像子块对应的类别标签估计值与所述每一多通道图像子块对应的类别标签值的接近程度。

5.根据权利要求1所述的方法,其特征在于,所述基于不同类别的用户交互信息,提取待编辑图像上不同类别的像素以构成不同类别的种子像素集具体包括:提取所述待编辑图像上与每一类别的用户交互信息对应的像素,并构成每一类别的种子像素集;

其中,每一类别的种子像素集中种子像素的数量满足几何分布,每一类别的种子像素集中种子像素在所述待编辑图像上的位置满足高斯分布。

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述根据所述待编辑图像上每一像素与每一类别的种子像素集中每一种子像素之间的空间距离,确定每一类别的种子像素集对应的所述待编辑图像的距离图,具体包括:对于所述不同类别的种子像素集中任一类别的种子像素集,计算所述待编辑图像上每一像素与所述任一类别的种子像素集中种子像素之间的最小空间距离,并将计算得到的每一最小空间距离作为所述待编辑图像对应位置上的像素值,确定所述任一类别的种子像素集对应的所述待编辑图像的距离图。

7.根据权利要求6所述的方法,其特征在于,若判断获知计算得到的任一最小空间距离大于255,则将所述任一最小空间距离更新为255。

8.一种图像颜色编辑装置,其特征在于,包括:

距离图确定单元,用于基于不同类别的用户交互信息,提取待编辑图像上不同类别的像素构成不同类别的种子像素集,并根据所述待编辑图像上每一像素与每一类别的种子像素集中每一种子像素之间的空间距离,确定每一类别的种子像素集对应的所述待编辑图像的距离图;

多通道图像子块提取单元,用于将每一个所述距离图作为所述待编辑图像的一个新的通道图,并结合所述待编辑图像的RGB三个通道图,确定所述待编辑图像的多通道图像,并从所述多通道图像中预设位置处提取预设数量的多通道图像子块,所述预设位置为所述多通道图像中与每一类别的用户交互信息对应的位置;

概率确定模块,用于基于训练好的多特征联合网络模型,提取每一多通道图像子块中的深度特征,根据所述深度特征,得到所述待编辑图像中每一像素所属类别的概率;

颜色编辑单元,用于根据得到的所述待编辑图像中每一像素所属类别的概率以及最小化的图像分割能量函数,确定所述待编辑图像中每一像素所属类别,并根据所述待编辑图像中每一像素所属类别,对所述待编辑图像的颜色进行编辑。

9.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1至7任一所述的方法。

10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。