1.一种基于神经网络的自动图像标注方法,其特征在于,包括以下步骤:获取实验数据集,并利用预先训练好的卷积神经网络模型提取所述实验数据集的图像特征;
从所述实验数据集的测试集中获取待标注图像,并根据所述图像特征,在所述实验数据集的训练集中,采用k近邻方法计算得到所述待标注图像的邻域图像集和与所述邻域图像集对应的第一标签域;
构建所述第一标签域与所述训练集对应的第二标签域之间的标签语义关联模型,根据所述标签语义关联模型,在所述第二标签域中计算得到与所述第一标签域中每个第一标签相关联的第三标签域;
计算所述待标注图像与所述邻域图像集中每个邻域图像之间的相似度,根据所有相似度得到所述第一标签域中每个第一标签成为所述待标注图像的目标标签的第一概率,并根据所有第一概率和所述标签语义关联模型得到所述第三标签域中每个第三标签成为所述待标注图像的所述目标标签的第二概率;
根据所有相似度、所有第一概率和所有第二概率,得到所述待标注图像的所述目标标签,并根据所述目标标签完成自动图像标注。
2.根据权利要求1所述的基于神经网络的自动图像标注方法,其特征在于,在获取所述实验数据集之后还包括以下步骤:获取ImageNet数据集,对所述ImageNet数据集进行训练,得到训练模型;
利用所述训练模型对所述实验数据集进行迁移学习,得到训练好的所述卷积神经网络模型。
3.根据权利要求1所述的基于神经网络的自动图像标注方法,其特征在于,得到所述邻域图像集和与所述邻域图像集对应的所述第一标签域的具体步骤包括:根据所述图像特征,计算所述待标注图像与所述训练集中每个训练图像之间的欧式距离;
将所有欧式距离按照从小到大的顺序排序,得到距离序列,并从所述距离序列的前端开始连续选取k个欧式距离,根据k个欧式距离一一对应的训练图像得到所述邻域图像集;
根据所述邻域图像集得到与所述邻域图像集对应的第一标签域。
4.根据权利要求3所述的基于神经网络的自动图像标注方法,其特征在于,所述第二标签域中的第i个第二标签与所述第一标签域中的第j个第一标签之间的所述标签语义关联模型具体为:
其中,wi为所述第二标签域中的第i个第二标签,wj为所述第一标签域中的第j个第一标签,I(wi)为在所述训练集中,出现第i个第二标签的第二图像集合,I(wj)为在所述邻域图像集中,出现第j个第一标签的第一图像集合,p1(wi|wj)为第i个第二标签与第j个第一标签之间的标签语义关联概率;
在所述第二标签域中,计算与所述第一标签域中的第j个第一标签相关联的第三标签的具体公式为:
5.根据权利要求4所述的基于神经网络的自动图像标注方法,其特征在于,计算所述待标注图像与所述邻域图像集中第t个邻域图像之间的相似度的具体公式为:其中,smr(·)为相似度函数,f为所述待标注图像,ft为所述邻域图像集中第t个邻域图像,为欧式距离对相似度的影响系数,dis(f,ft)为所述待标注图像与第t个邻域图像之间的欧式距离;
计算所述第一标签域中的第j个第一标签成为所述待标注图像的所述目标标签的第一概率的具体公式为:
其中,
1 1
其中,p(wj|f)为第j个第一标签成为所述目标标签的第一概率,p (f|wj)为第一概率的1
倒数,W 为所述第一标签域,G为所述邻域图像集,p2(wj|ft)为第j个第一标签相对于第t个邻域图像的贡献值控制函数,当第t个邻域图像中包含第j个第一标签时,p2(wj|ft)=1,当第t个邻域图像中不包含第j个第一标签时,p2(wj|ft)=0;
计算所述第三标签域中的第r个第三标签成为所述待标注图像的所述目标标签的第二概率的具体公式为:
2
其中,wr为所述第三标签域中的第r个第三标签,p (wr|f)为第r个第三标签成为所述待标注图像的目标标签的第二概率。
6.根据权利要求5所述的基于神经网络的自动图像标注方法,其特征在于,得到所述待标注图像的所述目标标签的具体步骤包括:将所有相似度按照从大到小的顺序排序,得到相似度序列,从所述相似度序列的前端开始连续选取预设数量的相似度,并根据预设数量的相似度一一对应的邻域图像得到相似图像集;
根据所述相似图像集中的所有邻域图像分别与所述待标注图像之间的相似度,以及所有邻域图像一一对应的第一标签数量,计算得到所述待标注图像的目标标签数量;
将所有第一概率和所有第二概率按照从大到小的顺序排序,得到概率序列,从所述概率序列的前端开始,按照所述目标标签数量连续选取对应个数的概率,并将选取的所有概率一一对应的第一标签或/和第二标签均作为所述目标标签。
7.根据权利要求6所述的基于神经网络的自动图像标注方法,其特征在于,当从所述相似度序列的前端开始选取两个相似度时,计算所述待标注图像的目标标签数量的具体公式为:
其中,n为所述目标标签数量,f1和f2分别为所述相似图像集中的两个邻域图像,smr(f,f1)和smr(f,f2)分别为所述相似图像集中的两个邻域图像分别与所述待标注图像之间的相似度,x1和x2分别为所述相似图像集中的两个邻域图像一一对应的第一标签数量;
当从所述相似度序列的前端开始选取a个相似度时,计算所述待标注图像的目标标签数量的具体公式为:
其中,fa别为所述相似图像集中的第a个邻域图像,smr(f,fa)为所述相似图像集中的第a个邻域图像与所述待标注图像之间的相似度,xa为所述相似图像集中的第a个邻域图像对应的第一标签数量。
8.一种基于神经网络的自动图像标注系统,其特征在于,包括获取模块、提取模块、计算模块和标注模块:
所述获取模块用于获取实验数据集;
所述提取模块用于利用预先训练好的卷积神经网络模型提取所述实验数据集的图像特征;
所述获取模块还用于从所述实验数据集的测试集中获取待标注图像;
所述计算模块用于根据所述图像特征,在所述实验数据集的训练集中,采用k近邻方法计算得到所述待标注图像的邻域图像集和与所述邻域图像集对应的第一标签域;
所述计算模块还用于构建所述第一标签域与所述训练集对应的第二标签域之间的标签语义关联模型,根据所述标签语义关联模型,在所述第二标签域中计算得到与所述第一标签域中每个第一标签相关联的第三标签域;
所述计算模块还用于计算所述待标注图像与所述邻域图像集中每个邻域图像之间的相似度,根据所有相似度得到所述第一标签域中每个第一标签成为所述待标注图像的目标标签的第一概率,并根据所有第一概率和所述标签语义关联模型得到所述第三标签域中每个第三标签成为所述待标注图像的所述目标标签的第二概率;
所述计算模块还用于根据所有相似度、所有第一概率和所有第二概率,得到所述待标注图像的所述目标标签;
所述标注模块,用于所述目标标签完成自动图像标注。
9.一种基于神经网络的自动图像标注装置,其特征在于,包括处理器、存储器和存储在所述存储器中且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现如权利要求1至7任一项权利要求所述的方法步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质包括:至少一个指令,在所述指令被执行时实现如权利要求1至7任一项所述的方法步骤。