利索能及
我要发布
收藏
专利号: 2020108022644
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种实现图像翻转不变性的方法,其特征在于:包括以下步骤:S1:对图像中所有的特征描述符进行聚类并生成视觉词汇;

S2:根据这些视觉词汇,建立索引结构模型来保存特征描述符;

S3:利用包含最多特征描述符的视觉词汇分析主要关键点的分布;

S4:确定对象是否翻转,并进行匹配。

2.根据权利要求1所述的实现图像翻转不变性的方法,其特征在于:步骤S1中,所述特征描述符通过SIFT算法生成,包括以下步骤:A.检测尺度空间极值:

使用高斯差分DoG来检测关键点,建立一个高斯金字塔,以确保匹配两幅图像时的比例不变性,并从细节到轮廓获取关键点;

B.过滤出正确的关键点:

利用尺度空间函数的泰勒函数来删除部分错误的关键点,并利用Hessian矩阵来过滤掉部分边缘点,尺度空间函数和Hessian矩阵的泰勒二阶展开式写为:其中x表示实际极值点,x'表示实际极值点和检测到的关键点之间的增量,DT表示D(x)方程的转置,表示DT对x的求导,σ表示高斯模糊系数;

C.方向分配:

采用以关键点位置为中心的高斯模糊函数来消除长距离像素的影响,将关键点周围的区域划分为16个子块,在不同的σ下,每个区域中的像素数不同,每个块在八个方向上有不同的统计数据,通过三线性插值计算所述统计数据,得到128个维度的数据,每个维度都是一个十进制数。

D.生成特征描述符。

3.根据权利要求2所述的实现图像翻转不变性的方法,其特征在于:步骤S1中,通过k-Means生成视觉词汇,用于代表所有特征描述符,具体包括:将所有特征描述符划分为k个聚类点,最小损失函数为:其中i表示第i个聚类点,x表示1张图片的1个特征描述符,Ci表示属于第i个视觉词汇的特征描述符,μi表示第i个视觉词汇;

通过迭代来最小化E的值,表示特征描述符在一个簇中具有高相似性,在不同的簇中具有高差异性,可视单词通过下式计算:

4.根据权利要求1所述的实现图像翻转不变性的方法,其特征在于:步骤S2中,所述建立索引结构具体包括以下步骤:在匹配两幅图像之前,定义其中一幅图像为原始图像,另一幅图像为匹配图像;

利用原始图像建立索引结构模型,即定义由这些特征描述符所生成的视觉词汇作为参考,找出两个图像之间相同或相反的分布;

对于匹配图像,特征描述符遵循所述参考并合并到视觉词汇中。

5.根据权利要求1所述的实现图像翻转不变性的方法,其特征在于:步骤S3具体包括:根据关键点的双边数量对视觉词汇的序列进行排序,选择包含两个图像之间的关键点数量最多的视觉词汇。

6.根据权利要求1所述的实现图像翻转不变性的方法,其特征在于:步骤S4具体包括:确定两个图像之间的分布,关注关键点在图像中的主要对象上的分布;

通过部分关键点得到中心;

在对两幅图像进行匹配时,采用kNN算法加快匹配速度,kNN算法原理如下:m0.distance<α*m1.distance使用欧氏距离比较每个特征描述和匹配,公式如下:当匹配对的欧氏距离越小,表示两者为同一个关键点的概率越大,从而得到匹配结果。

7.根据权利要求6所述的实现图像翻转不变性的方法,其特征在于:所述通过部分关键点得到中心,具体包括:使用10个关键点,其中5个是最左边的关键点,5个最右边的关键点,如果左侧的关键点数量大于相对于中心的右侧,在图像标签中设置1,反之为0;

根据两幅图像之间的两个标签,使用异或操作计算标签的结果,如果结果为0,则表示两个图像中的对象具有相同的方向,如果结果为1,则再次翻转匹配图像,以确保匹配对的数量。