1.一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,包括以下步骤:S1:确定需要进行区分的场景类别数s,选定训练样本和测试样本,每一类场景分别采集kt张图像作为训练样本,并选定ks张图像作为测试样本;
S2:采用网格化均匀提取Sift特征点,设定网格图像块大小pt和块间隔dt,对训练样本和测试样本中每张图像进行均匀化网格划分,得到若干个图像块,计算每个图像块的中心点sift特征描述向量,得到每张图像的特征描述向量集合Fi;
S3:设定Kmeans方法的聚类中心数c,迭代运算次数和收敛误差,对样本的所有特征描述向量进行K均值聚类,获得聚类中心向量集合,即词袋库W;
S4:Kmeans聚类过程得出每个单词包含的特征描述向量集,进而获得每个单词中特征点来源分布SW,计算每个单词对场景类别的表征能力,得到单词可信度向量R;
S5:根据词袋模型方法分别获得训练样本和测试样本的全局描述,即计算每张图像的特征直方图;
S6:基于修正直方图交叉核函数的相似性度量方法计算每个测试样本图像与每个训练样本的相似性,得到相似性矩阵I;
S7:设置k近邻分类中邻域大小d,基于近邻分类器分别计算每个测试样本所属的场景类别;
所述步骤S4单词可信度向量R=[r1,r2,…,rc],其中:其中,std(·)表示标准差, 表示聚类成单词i的所有特征点的个数;
所述步骤S6基于单词可信度修正直方图交叉核函数的相似性度量函数定义如下:其中,Xi为测试样本特征直方图描述向量集合X={X1;X2;…;Xm},Yj为训练样本特征直c方图描述向量集合Y={Y1;Y2;…;Yn},测试样本图像Xi的归一化特征直方图为H(Xi)∈R ,训c练样本图像Yj的归一化特征直方图为H(Yj)∈R,即
2.如权利要求1所述的一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,所述步骤S2中特征点的sift特征描述向量集合为:
1 2 p p×128
F={f ,f ,…,f}∈R (3)i
其中,f 表示特征点i的sift描述向量,p表示一张图像提取的sift特征点数,特征点由sift方法关键点检测确定,或通过图像均匀网格划分确定,128表示sift特征维数。
3.如权利要求1所述的一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,所述步骤S3词袋库W的生成方式为:W=Kmeans([F1,F2,…,FnTr],c)={w1,w2,…wc} (4)c×128
其中,W∈R 表示词袋库,通过对所有训练样本的sift特征集合进行k均值聚类获得,wj表示词袋库中的一个单词,c表示词袋库的大小,即单词的个数,每个单词128维。
4.如权利要求1所述的一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,所述步骤S5中生成图像特征直方图的方法如下:
1 2 p p×128
对于任一样本图像,假设其sift特征描述集合为Fk={fk ,fk ,…,fk}∈R ,其单词p分布为Dk={c1,c2,…,cp}∈R,则
其中,dis(·)表示欧式距离,即计算sift描述向量与单词库中每个单词的距离,距离最近的单词的编号即为ci,则对该图像整体描述的特征直方图表示为:Xk=hist(Dk)/p (6)其中,hist(·)表示频次统计的直方图,Xk表示归一化后的概率直方图。
5.如权利要求4所述的一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,假设训练样本特征直方图描述向量集合为Y={Y1;Y2;…;Yn},对应的类别标签为Lbl={l1;
l2;…;ln},测试样本特征直方图描述向量集合为X={X1;X2;…;Xm},则基于SVM的模式识别可表示为:
6.如权利要求1所述的一种基于优化视觉词袋模型的图像场景分类方法,其特征在于,所述步骤S7对于测试样本图像Xi,其与所有训练样本的相似性序列用Ii表示,
对Ii进行降序排序,取其前d个值构成 表示测试样本图像Xi与训练样本YDj的相似性,
用Bi={b1,b2,…,bd}表示与测试样本图像Xi最相似的前d个训练样本所属的场景分类,即训练样本YDj属于第bj类场景,统计与Xi最相似的d个训练样本所属的场景类别,即h=hist(Bi),hist(Bi)表示频次直方图,则Xi其所属的场景类别为:ci={k|hk=max(h)} (8)