买专利、卖专利、专利购买、专利交易、专利出售、高企申报-高分遥感图像人工构建筑场景智能分类方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

高分遥感图像人工构建筑场景智能分类方法

￥18000

专利号： 2024101142361

申请人：宜昌黑鹿屿森科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-08-19

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.高分遥感图像人工构建筑场景智能分类方法，其特征在于，建立一种面向视觉的场景表述方法，即通过超像素方法对图像进行过分割，以分割所得的同质视觉作为视觉词汇单元，通过对其光谱、纹理及空间信息特征进行描述作为视觉单词，改进隐层概率语义解析模型进行场景推算，通过结合遥感图像的成像特征，基于场景内容构成，采用面向视觉的策略解析地物的分布规律，提高视觉单词语义承载力，解决语义鸿沟问题，提高图像语义的映射层次；

1)基于分割视觉的高分遥感图像场景内容表达：采用超像素分割法，将图像进行过分割，以提取的分割视觉作为语义词汇，以分割同质区域为对象，进行特征提取，并采用语义模型进行推算，将图像内容转换为协同分布式语义；

具体包括：一是基于目标提取的场景内容推算：对图像进行分割，将分割所得的图像面元作为基本单位，利用色彩、纹理、以及空间特征进行多特征计算，实现视觉目标的识别和分类；二是基于视觉特征的场景目标表达：对过分割所得的图块视觉从图层值特征、纹理特征和空间信息特征三方面描述，并将其合并形成特征向量，其中图层特征通过计算每个波段的光谱信息得到，空间信息特征通过计算视觉的像元在图像坐标中的分布特征，实现视觉的类别信息标记；三是基于多模特征分割的场景目标视觉获取：对空间特征点进行聚类，样本点沿梯度上升方向漂移直至平移向量小于极小值，假设{xi|i∈1，2，3…n}表示d维欧d式空间R的任意n个点组成的样本点集合Sn，在样本点x处，以核函数K(x)和窗口宽h估算的核密度函数来计算邻域各个样本点对中心点特征贡献：其中sk,d为满足轮廓函数k()积分倒数为1常系数，n为样本数量,h为带宽大小，在图像解析中为局部邻域的大小，xi为第i个样本参考点，x为核函数的中心点，通过核函数的密度估算，将每个数据点为中心的局部核函数的平均值作为被估算点的中心的窗口内计算被估算点的加权局部平均，计算均值漂移向量为：权重系数vi满足约束条件：

多模特征通过计算窗口中心点的多模特征矢量,沿梯度上升方向进行逐步迭代至新位置，直至局部极大值点接近零，步长逐步减小，缓慢接近收敛点；

2)基于隐层概率语义解析的遥感图像场景分类：对场景内容进行精确的语义描述，在高层语义和底层特征之间建立有效的关系,采用基于中层的语义场景建模方法，通过事先假设图像中隐含的抽象概念，采用视觉词汇法来表示图像中实体信息的中间语义特征，同类场景具有相近的词汇概念分布，通过中间语义词汇的概念分布划分图像的语义属性，将基于分割视觉的场景目标词汇表达方法与概率推算模型相结合，提高语义表达的层次；

具体包括：一是隐层概率语义解析模型；二是基于视觉词汇的遥感图像场景语义解析；

三是基于建筑识别分类器的判别分类；

隐层概率语义解析模型：在图像场景语义解析中,对图像的分类通过对输入的图像依据其计算特征建立概率模型来求解分类问题，即先通过建模类条件分布p(x,ck)，x表示出入数据，ck代表类别，然后根据贝叶斯公式计算后验概率p(ck,x)来预测分类情况，隐层概率语义解析转化为数据共生概率计算模型，将图论和概率计算解析相结合，通过定义概念或随机变量表示视觉的属性特征，采用图模型表示文本、词语、焦点之间的关系；

基于视觉词汇的遥感图像场景语义解析：利用高分图像过分割特征,以分割后的图像视觉作为基本特征词汇单元，在图像分割的基础上，对每一个同质性区域视觉进行光谱、纹理和形状特征提取，形成特征向量集，以此作为视觉单词纳入隐层概率语义解析模型进行分类，具体步骤如下：步骤一：提取图像特征：对所有图像进行均值漂移分割，对过分割图像进行特征提取，随机选取一部分图像作为训练图像，对该部分图像特征向量采用聚类生成视觉词汇，指定词汇数量V，得到文本‑词汇共生矩阵V×M的词频矩阵N(wv，dm)，其中表示词汇wv在文本dm出现的次数；

步骤二：因子训练：对训练图像数据进行因子估算，指定文本具有K个焦点，求解P(wv|zk)和P(zk|dm)，其中P(wv|zk)用于后续图像焦点分布向量计算，P(zk|dm)作为K维的中间向量来表示每一幅图像，用于训练分类器；

步骤三：测试图像：对测试图像，由步骤一所得的聚类中心作为视觉词典，对每一个特征向量进行相近性度量，得到训练图像的文本‑词汇频率矩阵，计算训练图像的焦点分布，根据式13计算测试图像的焦点概率向量P(zk|dtest)；

步骤四：类别判断：采用训练好的分类器对测试图像进行分类，以训练图像的焦点分布向量最为训练样本，输入场景类别标签；对步骤三中得到的每幅测试图像的焦点向量输入建筑识别分类器，对每幅图像进行归类，获取语义标签，得到分类混淆矩阵,评价分类精度；

基于建筑识别分类器的判别分类：首先寻找最优超平面，假设样本X{x1,x2,…,xn}，类n别标签为yi∈{1，‑1}，n为样本个数,R为n维样本空间,该分类问题转化为寻找最优的超平面y＝wx+b,是的该平面与两类样本点距离最大，对所有样本点满足式13：分类间隔需满足最小,实现分类间隔最大，最优超平面问题通过

Lagrange转换成加不等式的约束问题；

建筑识别分类中核函数的选择对分类性能影响大，核函数的引入使样本空间升维后变得线性可分，在原始样本空间进行核函数计算，高维空间内分类问题得以用线性法完成；

在高分图像分类中，分类特征是综合亮度、纹理的特征以及其它的信息来改善分类效果，特征维数达到几十维甚至数百维，建筑识别分类通过核函数的方式将数据隐式表达为某种特征空间，将非线性的分类问题转化为线性的分类问题；

构造多类分类器，在任意两类样本之间建立一个建筑识别分类器，k个类别的样本就需要设计k(k‑1)/2个建筑识别分类器，当对一个未知样本进行分类时，在每一个两类样本训练后的分类器之间进行分类,按照每一次二类分类的分类结果进行记名投票，分类得到归属的类别票数增一，最后得票最多的类别即为该未知样本的类别。

2.根据权利要求1所述高分遥感图像人工构建筑场景智能分类方法，其特征在于，基于目标提取的场景内容推算：首先对场景中目标进行有效提取和特征表述,然后通过隐层概率语义解析方法对图像数据进行压缩，将图像从空间维变换到焦点空间进行抽象表示，降低特征维数和信息冗余，然后采用分类器进行有效归类，从有限样本中学习场景知识，自动指导场景分类；

采用分割策略基于像素块的整体特质进行图像处理，然后在每个对象内进行图像特征聚类，通过对高空间分辨率图像的过分割，获得同质区域，通过对分割所得区域进行有效的特征表示使特征向量包含多元语义信息,对不同的目标视觉进行精细划分；

在场景视觉精确描述的基础上，通过隐层概率语义解析，对图像进行焦点表示，综合场景图像各种地物的分布特征,将场景语义进行充分的表达，基于场景的地物构成,利用基于分割视觉基元的解析和语义知识推算表示各目标单元之间的空间关联、空间配置、空间相互作用规则，从场景本身抽象语义信息内容。

3.根据权利要求1所述高分遥感图像人工构建筑场景智能分类方法，其特征在于，图层特征是各个波段数据的光谱特征,相对于其它视觉特征，色彩特征对图像的尺寸、方向和视角依赖程度小，其计算方法包括：平均值构成该图像视觉的所有像素的平均值：

式1中表示图层L的灰度均值，n表示像素个数，CLi表示第i个像素的灰度值，下同；

方差σL：由构成图像视觉所有像素值和均值差的平方和：

亮度B：图像视觉图层数量除以包含光谱信息的图层平均值总和,即图像视觉的光谱平均值的平均值：式3中nL代表图像的波段总数, 代表视觉在各波段均值，下同；

贡献率rL：图像视觉在某一层的平均值除以所有光谱层的平均值的总和，如式4：

反应该层光谱平均值占所有图层均值总和的比例。

4.根据权利要求1所述高分遥感图像人工构建筑场景智能分类方法，其特征在于，模型构建：设一个数据库包含M篇文本,其中dm表示第m篇，假设组成所有文本的单词构成的集合为V，其中wv表示第v个单词，P(dm，wv)表示单词wv在dm中出现的概率，在文本和单词之间引入了一个隐含焦点变量，一个文本包含多个焦点，这些焦点服从多项式分布，假设共存在K个焦点,即模型中共有K个隐含的变量zk，将原有的由词汇表示的文本转化为更高层次的有焦点向量表示的文本；

模型定义文本生成焦点和词汇的过程如下：假定p(dm)生成一篇文本dm，在给定文本生成的条件下，依照概率P(zk|dm)生成某个焦点zk，在给定焦点zk生成的条件下，依照概率P(wv|zk)生成某个视觉单词，其中dm和wv根据文本‑词汇共生矩阵获得，为可观测变量，该模型成立的前提是，文本和词汇独立产生，与隐层焦点无关，且词汇和隐层焦点也独立产生，与具体文本无关；

假设给定一篇文本可推算出焦点z的分布P(dm|wv)，给定一个焦点，推测出wv的分布P(wv|zk)，P(zk|dm)和P(wv|zk)即为待估算的模型因子，通过训练样本，求得其协同似然函数：得到：

m,n

令w 表示第m篇文本的第n个单词，根据最大似然估算准则其对数似然函数为两边取对数可得对数似然函数，将上式展开得到：其中n(dm,wv)，表示文本dm中单词wv出现的次数，后一项与zk无关，得到：

建立隐层概率语义解析模型。

5.根据权利要求1所述高分遥感图像人工构建筑场景智能分类方法，其特征在于，最大化因子估算：采用期望最大化进行求解；步骤如下：第1步：期望步骤，随机初始化因子在当前估算因子的基础上求隐变量的后验概率；

第2步：根据第1步的结果，通过最大化对数自然函数的期望，计算新的因子值；

重复以上两个步骤，直至对数自然函数值收敛；

其中，在第1步中，由贝叶斯公式计算隐变量的概率P(zk|dm,wv)，此时假设P(wv|zk)和P(zk|dm)两个因子已知；

在第2步中，通过最大化完备数据似然的期望值来逼近似然函数的下线L：