1.基于图片语义和视觉散列的图片检索方法,其特征在于,包括以下步骤:步骤1:利用图片特性和视觉特性训练语义散列函数;
步骤2:利用最大熵原则,获得紧凑的二进制码;
步骤3:利用函数衰减原理,消除视觉特征的噪声。
2.根据权利要求1所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述步骤1包括:利用图片特性和视觉特性训练语义散列函数,所述的散列函数表示如下: 式1
选择图片投影的均值作为偏差项 让每个散列比特bc(xi)接近平衡,且有最大熵,即:Bc(xi)=0.5(hc(xi)+1) 式2由H=[h1,h2,…,hc]∈Rd×c,所以xi的相关性散列码表示为:T T
H(xi)=sgn(Wxi-Wm) 式3由于对X进行了归一化,所以H(xi)表示为如下形式:H(xi)=sgn(WTxi) 式4由于图片X={xi}N i=1,所以相关性散列码H(X)表示成如下形式:T
H(X)=sgn(WX) 式5式2为探索原始数据的潜在信息,应尽量保留原始数据的邻域结构特征,构建元素为Sij的N×N相似矩阵S时,就充分利用了图片数据的局部邻域信息,即: 式6
上式中的K(xi)表示特征向量xi的k近邻;
两幅图片Ii和Ij间的汉明距离d(h(xi),h(xj)),是计算它们各自散列二进制码h(xi)和h(xj)不同的比特数,即: 式7
接着,图片Ii和Ij间的相似性SH(Ii,Ij)定义为h(xi)和h(xj)间汉明距离的均值,即: 式8
上式中,当Ii和Ij完全相同时SH(Ii,Ij)=1,当Ii和Ij完全不同时SH(Ii,Ij)=0;
基于邻域信息,图片Ii和Ij间的相似性表示为: 式9
式9用于保存邻域信息。
3.根据权利要求1或2所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法利用语义和视觉信息是为了确保汉明空间中,相似的图片映射到相似的散列码上,且此时的目标函数表示为: 式10
上式中的SH、SS、SV分别表示汉明空间、语义空间、视觉空间中的相似性,分别定义为: 式11
式12
上式中的μ为‖xi-xj‖的中值;
除保留映射相似性外,二进制散列码还具有紧凑性和判别性,二进制散列码的紧凑性,表现为每个二进制散列码只可能是-1或1,通过最小化函数得到,即: 式13
这类似于最大化二进制码向量的熵,二进制散列码的判别性,表现为每个二进制散列码都应尽可能接近-1或1,通过最大化如下所示的函数得到,即: 式14
因此,二进制散列码紧凑性和判别性的最优化为: 式15。
4.根据权利要求3所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法包括矩阵熵,所述矩阵熵的最大值等价于矩阵方差的最大值,且散列函数方差的最大值小于投影数据方差的上界,由此得到下面的等式,即: 式16。
5.根据权利要求4所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法为消除视觉信息噪声,引入函数衰减原理,包括: 式17
上式中,当相关视觉特征是噪声时‖wc‖=0;
利用式10的相似性保持、式15的二进制散列码的紧凑性和判别性、式17的视觉特征噪声消除这三个条件,得到图片检索最优的目标函数,即: 式18
上式中的λ、μ、ν为控制每一项权重的参数。
6.根据权利要求5所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述的更新速率为ζ的随机梯度下降迭代算法,用于求解目标函数,即: 式19
上式中的∏∈Rc×d是一个对角矩阵,其元素为∏c=1/‖wc‖2。
7.根据权利要求5所述的基于图片语义和视觉散列的图片检索方法,其特征在于:所述方法应用于大型图片库的检索。