利索能及
我要发布
收藏
专利号: 2015100811684
申请人: 武汉工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-17
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于尺度不变特征极限学习机的机器人场景识别方法,其特征在于,包括以下步骤:步骤S1,图像预处理;

对原始场景图像进行校准,增强以及归一化工作,得到尺寸一致,灰度值取值范围相同的标准化图像集;

所述原始场景图像包括场景的注册库图像和测试图像,其中场景注册库包括针对不同的场景预先采集的多张图像,用于学习码本和训练极限学习机,测试图像是采集用来测试识别算法的图像;

步骤S2,对注册库图片进行尺度不变特征转换,包括构造尺度空间;确定关键点;对关键点进行精确定位;确定尺度不变特征描述向量;

合并所有训练图片的尺度不变特征描述向量构成新的矩阵;

步骤S3,对矩阵进行聚类处理,确定聚类中心的个数,得到用聚类中心构建而成的码本;

步骤S4,对场景图片进行尺度不变特征转换,将该尺度不变特征描述向量向码本做映射,得到其特征系数;对各个特征系数进行标签分类后得到相应的码本系数矩阵;

步骤S5,利用码本系数矩阵训练建立基于极限学习机的神经网络,对极限学习中节点个数参数进行优化设置,通过随机初始化网络的输入权值以及隐元的偏置,得到隐层输出矩阵;

步骤S6,输入测试场景图像的码本系数矩阵,利用极限学习机的优化参数预测输出场景图像的类别属性,完成场景识别过程。

2.根据权利要求1所述的识别方法,其特征在于,所述步骤S2中具体如下:取训练单张图片,

S2.1)首先利用高斯核的卷积来生成构建尺度空间:

L(x,y,σ)=G(x,y,σ)*I(x,y)  (1)式中(x,y)表示空间坐标,σ表示尺度坐标;L(x,y,σ)为高斯核的尺度表达式,G(x,y,σ)为高斯核,I(x,y)为输入的图像;

为了在尺度空间中关键点的有效性,建立高斯差分尺度空间DOG;

D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)=L(x,y,kσ)-L(x,y,σ)  (2)S2.2)对关键点进行定位;将空间尺度函数泰勒展开求导并令其为0,得到精确位置

S2.3)将得到的关键点进行进一步筛选:

S2.3.1)去除对比度低的点:将公式(4)带入(3),在DOG空间极值处D(x)去前两项得若 则保留特征点;

S2.3.2)通过Hessian矩阵求出主曲率;Hessian矩阵 D为高斯差分函数,利用采样点相邻差估法得到D的导数,求出H的特征值就能得到D的主曲率,从而去除不稳定的边缘响应;

S2.4)确定关键点后,求关键点的位置尺度信息;采用梯度模值和梯度方向的计算公式;

θ(x,y)=tan-1((L(x,y+1)-L(x,y-1))+(L(x+1,y)-L(x-1,y)))  (6)m(x,y),θ(x,y)梯度范围是0~2π,设定每10度一个柱,共36个柱,直方图中能量最高的柱子对应的方向为关键点的主方向;能量达到主峰能量的80%的峰的方向作为该关键点的辅方向;

S2.5)将关键点附近领域的高斯图像梯度统计结果表示成一个矢量,即为单张图片尺度不变特征描述向量,将所有训练图片的尺度不变特征描述向量聚集成为新的矩阵M。

3.根据权利要求2所述的识别方法,其特征在于,所述步骤S3中聚类处理,构造码本的步骤如下:S3.1)选取k个初始聚类中心Zj(I),j=1,2,3,...,k;I表示聚类中心矩阵;

S3.2)计算每个数据对象与聚类中心的距离

D(xi,Zk(I)),i=1,2,3,..,n;j=1,2,3,...,k,如果满足D(xi,Zk(I))=min{D(xi,Zk(I),j=1,2,3,..,n)}  (7)那么xi∈wk,wk为所有样本和聚类中心之间的距离;

S3.3)计算误差平方和准则函数Jc,

S3.4)判断:若|Jc(I)-Jc(I-1)|≤ξ则结束;否则I=I+1,计算新的聚类中心,返回步骤S3.2);

得到k个聚类中心构建的码本o;维数是k×128,每一列代表一个聚类中心的特征信息。

4.根据权利要求3所述的识别方法,其特征在于,所述步骤S4中特征向量在码本上映射后得到带有聚类中心类别信息的特征向量的具体过程如下:S4.1)初始化矩阵R,维数为k*1;矩阵R为记录输入特征在码本身上的投影数值大小矩阵;

S4.2)利用最小乘积法得出每一个特征点属于码本O中的聚类中心的类别;选取尺度不变特征矩阵M的第i个特征点,i=1,2,3,...,n,则M(xi,yj),j=1,2,3,...,128代表该特征点的特征信息,找出该特征点与k个聚类中心的向量积最小值Ans以及取最小值时聚类中心所对应的种类t;

其中

若第t行与之向量积最小,则该特征点属于第t类聚类中心;矩阵R第t行数值+1;

S4.3)n次取值后,矩阵R则代表尺度不变特征向量M中的n个特征点在k个聚类中心中出现的次数情况,定义矩阵R为带有聚类中心类别信息的特征向量,维数是k×1;接下来将所有待分类图片的带有聚类中心类别信息的特征向量聚集为新的矩阵,并在每一列的列首加上其类型信息,得到待分类的码本系数矩阵,维数是(1+k)×r,r是待分类的图片张数。