1.一种面向单类别低信息量数据的图文匹配方法,所述方法包括步骤:将数据集划分为训练集、测试集;
用高斯核函数对训练集、测试集的低信息量数据进行核化处理;
构造针对单类别低信息量数据图文匹配问题的目标函数和投影学习公式;
所述目标函数为:
r×n T
s.t.B∈{‑1,1} ,QQ=I
其中, 为低信息量图像数据矩阵, 为低信息量文本数据矩阵,其中d1、d2为低信息量图像、文本数据的维度,n为样本数量, 为核化后的q×r
图像、文本数据矩阵,其中q为核化后数据的维度,U1、U2∈R 分别为图像、文本的基矩阵,r×n r×n其中r为哈希码长度,V∈R 为图像、文本的统一表示矩阵,C1、C2∈R 分别为图像、文本的c×n c×r r×r特定表示矩阵,L∈R 为标签矩阵,其中c为标签种类的数量,R∈R 为投影矩阵,Q∈Rr×n为具有正交约束的投影矩阵,I为单位矩阵,B∈{‑1,1} 为元素是‑1或1的哈希码矩阵,K、Yr×n∈R 为辅助矩阵,用于后续优化,tr(·)为矩阵的迹, 为矩阵的F‑范数的平方,||·||*为矩阵的核范数,Re(·)为·中每一项的F‑范数的平方加和,λ1、λ2、α、β、γ、ω、μ1、ρ为权衡参数;
所述投影学习公式为:
c×n
其中,r为哈希码长度,M∈R 为单位化后的标签矩阵,即Mi=li/||li||2,li为标签矩阵r×qL的第i列向量,||·||2为向量的2‑范数,Ht∈R 为第t个模态的哈希投影矩阵,t=1时,模态为图像,t=2时,模态为文本,其中q为目标函数中提到的核化后数据的维度,μ2为权衡参数;
利用优化算法1优化目标函数,得到哈希码矩阵B;
所述优化算法1总结如下:
利用上述步骤得到的哈希码矩阵B和哈希投影矩阵H1、H2对测试集进行测试并计算图文匹配的平均准确率。
2.根据权利要求1所述的一种面向单类别低信息量数据的图文匹配方法,其特征在于,将所述高斯核函数定义为:其中,x为数据样本的一个列向量, 为对x进行高斯核化处理的第i个元素,其中 为向量的2‑范数的平方, 为从数据样本中不重复随机提取的q个列向量,q的大小也即目标函数中核化后数据的维度, 为核宽度,其中n为样本数量,xi为数据样本的第i列向量,gj为 中的第j个列向量,||·||2为向量的2‑范数。