利索能及
我要发布
收藏
专利号: 201610128827X
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-04-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于图片语义和视觉散列的图片检索方法,其特征在于,包括以下步骤:步骤1:利用图片特性和视觉特性训练语义散列函数;

步骤2:利用最大熵原则,获得紧凑的二进制码;

步骤3:利用函数衰减原理,消除视觉特征的噪声。

2.根据权利要求1所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述步骤1包括:利用图片特性和视觉特性训练语义散列函数,所述的散列函数表示如下:   式1

选择图片投影的均值作为偏差项 让每个散列比特bc(xi)接近平衡,且有最大熵,即:Bc(xi)=0.5(hc(xi)+1)   式2由H=[h1,h2,…,hc]∈Rd×c,所以xi的相关性散列码表示为:T T

H(xi)=sgn(Wxi-Wm)   式3由于对X进行了归一化,所以H(xi)表示为如下形式:H(xi)=sgn(WTxi)   式4由于图片X={xi}N i=1,所以相关性散列码H(X)表示成如下形式:T

H(X)=sgn(WX)   式5式2为探索原始数据的潜在信息,应尽量保留原始数据的邻域结构特征,构建元素为Sij的N×N相似矩阵S时,就充分利用了图片数据的局部邻域信息,即:   式6

上式中的K(xi)表示特征向量xi的k近邻;

两幅图片Ii和Ij间的汉明距离d(h(xi),h(xj)),是计算它们各自散列二进制码h(xi)和h(xj)不同的比特数,即:   式7

接着,图片Ii和Ij间的相似性SH(Ii,Ij)定义为h(xi)和h(xj)间汉明距离的均值,即:   式8

上式中,当Ii和Ij完全相同时SH(Ii,Ij)=1,当Ii和Ij完全不同时SH(Ii,Ij)=0;

基于邻域信息,图片Ii和Ij间的相似性表示为:   式9

式9用于保存邻域信息。

3.根据权利要求1或2所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法利用语义和视觉信息是为了确保汉明空间中,相似的图片映射到相似的散列码上,且此时的目标函数表示为:   式10

上式中的SH、SS、SV分别表示汉明空间、语义空间、视觉空间中的相似性,分别定义为:   式11

   式12

上式中的μ为‖xi-xj‖的中值;

除保留映射相似性外,二进制散列码还具有紧凑性和判别性,二进制散列码的紧凑性,表现为每个二进制散列码只可能是-1或1,通过最小化函数得到,即:   式13

这类似于最大化二进制码向量的熵,二进制散列码的判别性,表现为每个二进制散列码都应尽可能接近-1或1,通过最大化如下所示的函数得到,即:   式14

因此,二进制散列码紧凑性和判别性的最优化为:   式15。

4.根据权利要求3所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法包括矩阵熵,所述矩阵熵的最大值等价于矩阵方差的最大值,且散列函数方差的最大值小于投影数据方差的上界,由此得到下面的等式,即:   式16。

5.根据权利要求4所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述方法为消除视觉信息噪声,引入函数衰减原理,包括:   式17

上式中,当相关视觉特征是噪声时‖wc‖=0;

利用式10的相似性保持、式15的二进制散列码的紧凑性和判别性、式17的视觉特征噪声消除这三个条件,得到图片检索最优的目标函数,即:   式18

上式中的λ、μ、ν为控制每一项权重的参数。

6.根据权利要求5所述的基于图片语义和视觉散列的图片检索方法,其特征在于,所述的更新速率为ζ的随机梯度下降迭代算法,用于求解目标函数,即:   式19

上式中的∏∈Rc×d是一个对角矩阵,其元素为∏c=1/‖wc‖2。

7.根据权利要求5所述的基于图片语义和视觉散列的图片检索方法,其特征在于:所述方法应用于大型图片库的检索。