利索能及
我要发布
收藏
专利号: 2014104392952
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于局部空间约束图模型的图像分类方法,其特征在于,包括以下步骤:

1)参数学习步骤:

1-1)将训练集里的每一幅图像分解为N1个子区域;

1-2)将每个子区域子划分出N2个均匀的图像块;

1-3)提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集;

1-4)预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心;用聚类中心对底层特征集中的底层特征进行量化得到图像块的视觉单词;

1-5)将训练集中所有子区域图像块对应的视觉单词代入局部空间约束的图模型中,进行参数的学习:

1-5-1)先更新简单图模型的dirichlet分布超参数γ和多项式分布参数χ,参数γ、χ中各元素的迭代更新过程为:其中, 表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维, 初值为1/KZ,d的取值范围为1~D,D为训练集中图像的总数,n1的取值范围为1~N1,i的取值范围为1~KZ,KZ为中层语义的总数,αi是局部空间约束图模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别, 为类别为局部空间约束图模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数, 的初值为1/V,V表示视觉单词的总数, 是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维, 的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(·)求导,Γ(·)为Γ分布函数,KT表示位置的总数, 表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词, 为简单模型中第d幅图像第n1子区域的位置为第l个位置;

将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,判断当前参数γ和χ是否满足迭代结束条件,如是,进入步骤1-5-2),如否,继续迭代过程;

1-5-2)将参数γ和χ作为输入,用牛顿-拉夫逊Newton-Raphson迭代方法更新局部空间约束图模型中主题下的狄利克雷dirichlet分布超参数α;

局部空间约束图模型中主题下视觉单词的多项式分布参数β中各元素的更新方法如下:其中, 表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,函数δ(cd,c)表示当cd=c时,c表示图像的类别,函数输出为1,否则函数输出为0;

判断当前得到的参数α、β是否满足迭代结束的条件,如是,则进入步骤2,否则返回步骤

1-5-1)继续迭代更新参数γ和χ;

2)图像测试:

2-1)将测试图像分成分解为N1个子区域,将每个子区域子划分出N2个均与的图像块,对于每个图像块提取底层特征进行量化得到对应的视觉单词;

2-2)将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ,参数γ、χ中各元素的迭代更新过程为:当γ和χ两个参数迭代至收敛后,得到测试图像对应的简单图模型的dirichlet分布超参数γ和多项式分布参数χ;

2-3)将测试图像对应的简单图模型的多项式分布参数χ以及学习得到局部空间约束图模型中主题下视觉单词的多项式分布参数β用来计算测试图像的类别c*为:其中, 为取目标函数最大时c的值, 是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维, 表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。