欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2021116037241
申请人: 韩效遥
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.内容自适应感知的网络地图智能推荐系统,其特征在于,把基于图像内容的聚类与图像推荐融入网络地图服务的检索和推荐,从数据收集处理、缩略图生成、图像聚类、平台搭建一整套技术流程,再此基础上设计实现Web端的地图服务检索推荐平台,主要包括:第一,基于信息量和近似度的网络地图服务自动采样方法,包括:一是地图瓦片信息量计算评估,二是计算跨尺度地图瓦片近似度;采用信息量联合四叉树结构定位地图中内容丰富的区域,信息量由图像复杂度近似表达;近似度通过色彩量化统一直方图计算,用来筛选发生突变的缩放比例,二者分别从平面位置维和缩放比例维实现地图服务的有序遍历,为基于图像内容的聚类推荐提供有效数据;

第二,色彩与纹理驱动的图像聚类地图推荐,包括:一是综合色彩与纹理特征的地图特征协同表示,二是地图内容图像聚类,三是基于图像组的聚类方法,四是基于图像组的地图服务推荐;采用色彩特征和纹理特征综合表示图像特征,色彩特征采用色彩量化统一直方图表示,纹理特征选择灰度共生矩阵表示,并考虑图像组的包含关系和色彩的相似性,图像组推荐方法通过对近似度不同组赋予不同权重值减少图层定位引起的近似度差异,提出综合色彩与纹理的多特征表示方法,实现基于图像组的地图服务推荐;

第三,搭建网络地图智能检索推荐平台,包括:一是地图智能检索推荐平台架构,二是是网络地图数据采集处理,三是地图关键字检索库,四是地图图像预处理与图像检索,五是网络地图智能检索推荐平台搭建访问;通过编译网络爬虫爬取大量地图服务,解析其元数据存储到数据库,基于Apache Solr服务建立关键字检索库并发布关键字检索服务,为每个服务生成缩略图并存储,计算每幅缩略图的色彩与纹理特征存储到特征库,把聚类结果存储到类别库中,推荐相似图像时,首先找到其所在类别然后在此类别下找出最相似图像推荐给用户。

2.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,基于内容的地图服务预览自适应采样方法:采用部分网络地图瓦片作为预览图,在瓦片地图模式下,地图服务简明表达定义为从大量地图瓦片中筛选出若干可代表地图服务内容的瓦片,进一步分解为两个子模块:平面位置维的瓦片选择与缩放比例维的瓦片选择;

(1)平面位置维的瓦片选择:基于特定缩放比例,量化地图瓦片的代表性,采用地图瓦片的复杂度因子近似表示其信息量并作为瓦片代表性的量化指标;

(2)缩放比例维的的瓦片选择:关键是找到发生突变的瓦片,采用图像近似度来定量评价两个比例尺瓦片之间的相似程度,并以此为依据来判定发生显著变化的缩放比例;

以复杂度和近似度两个量化指标为基础,用两轮筛选分别实现平面位置维全覆盖和缩放比例维多尺度的瓦片自动选择:

第1轮筛选,从最小的缩放比例开始,每一级只选择最复杂的瓦片,并以该瓦片的地理范围作为约束处理下一个缩放比例,第一轮筛选滤除绝大多数瓦片;

第2轮筛选:比较缩放比例间瓦片的近似度,进一步去冗余,将采样集合定义为R,具体步骤如下:

步骤一:从L0级开始,将L0级中唯一的地图瓦片加入R,并作为种子瓦片;

步骤二:请求更高一级的、与种子瓦片相同地理范围的4张地图瓦片,将其中信息量最丰富的瓦片Ringo作为新的种子瓦片;

步骤三:拼合4张瓦片得到Rpvda,若Rpvda和种子瓦片的近似度大于临界值,将Rpvda加入R,反之则不加入;

重复步骤二和步骤三直至遍历所有缩放比例,得到最终的采样图集合;

多个变量灵活调节:相邻缩放比例的瓦片数量并不一定满足4倍关系,影响拼合的瓦片个数,将信息量最丰富的前r(r≥1)个瓦片作为种子瓦片,增大得到代表性瓦片的概率。

3.根据权利要求2所述内容自适应感知的网络地图智能推荐系统,其特征在于,地图瓦片信息量计算评估:基于地图信息量进行第1轮筛选,在每个缩放比例下选择信息量最丰富的地图瓦片作为种子瓦片,并以种子瓦片覆盖的地理空间范围为约束启发式遍历下一级缩放比例,除L0和L1级之外,并不保证其它级别的种子瓦片具有最大信息量,但以较小计算代价得到较高命中率,粗选后每一级参与比较的地图瓦片均不超过4个;

在地图信息量计算评估方面,采用地图瓦片在压缩后的数据量作为其信息量的表征指标,采用地图瓦片在PNG格式下的数据量作为信息量指标。

4.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,计算跨尺度地图瓦片近似度:比对相邻两个缩放比例间地图瓦片的近似度,并依此判断突变或缓变,只保留发生显著变化的地图瓦片;从色彩特征入手分析地图瓦片的相似程度,采用色彩量化统一直方图来量化表达地图的色彩特征,在此基础上基于余弦距离权重度量地图瓦片的近似度;

本申请结合地图表达特征对直方图生成方法做两点改进:改进1,针对色彩量化:首先对地图瓦片进行色彩量化,先将待比较的两张瓦片拼合到一起,统一管理二者的所有颜色,量化得到显著且唯一的色彩集合;

改进2,计算颜色的出现频率:首先将地图剖分为若干个连续色块,并用这些色块的周长来计算相应色彩的出现频率,连续色块的划分标准是相同色彩的像素在四邻域相邻接,周长计算采用摩尔邻域边界跟踪方法;

RGB色彩空间下,色彩量化采用最小方差法,指定保留的色彩数量,基于量化后的色彩集合,分别统计每种色彩在两张瓦片中的出现频率,得到色彩量化统一直方图,最后采用余弦距离计算直方图之间的相似程度;将直方图中占比最大的色彩权重值设置为0,抑制其对近似度的影响。

5.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,色彩与纹理驱动的图像聚类地图推荐:根据图像特征对地图图像分类,图层推荐前先对图层进行聚类缩小相似图层查找范围,分别使用色彩量化统一直方图和灰度共生矩阵表示图像的色彩与纹理特征,在为每个图层生成3张采样图的基础上,针对网络地图服务特征的图像组聚类推荐;

综合色彩与纹理特征的地图特征协同表示:对一幅彩色地图,其色彩特征和纹理特征分别记为Gs和Gr,对给定的两幅图像D和E,记它们之间的色彩特征差异为As,纹理特征差异为Ar,k1和k2分别为两种特征间距离的权重值,则D与E之间的综合距离为:A(D,E)=k1*As(GSD,GSE)+k2*Ar(GrD,GrE)以此作为地图图像和检索的相似性比较方法。

6.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,地图内容图像聚类:在聚类之初把地图数据集中的所有对象都作为聚类中心,每次迭代中,各个聚类中心通过消息传递模式更新,每一次迭代之后在竞争中失败的对象选择一个聚类中心作为其中心,通过不断迭代和选择,最终得到多个优质的聚类结果;

根据M个地图数据点之间的近似度进行聚类,这近似度构成了M×M相似性矩阵,把所有地图数据点当做潜在的聚类中心Z,C矩阵对角线上的值c(w,w)越大,点w成为聚类中心的几率越大,其值为参照度q,传递机制主要包吸引因子和归属因子,更新吸引因子和归属因子矩阵,为避免结果振荡,引入衰减系数k,在更新信息时,每个信息被设置为上次迭代更新值的k倍加上该次信息更新值的1‑k倍,其中衰减系数k是0和1之间的实数,即第r+1次t(j,w)与d(j,w)的迭代值:

dr+1(j,w)←(1‑k)dr+1(j,w)+kdr(j,w)地图内容图像聚类的具体步骤:

步骤1:初始化参数,并读取地图内容数据;

步骤2:计算近似度矩阵,并求出近似度矩阵的中位值并赋给参照度q;

步骤3:更新吸引因子矩阵、更新归属因子矩阵;

步骤4:判断是否达到最大迭代次数或满足终止条件,若是则跳转步骤2,否则进行步骤

5;

步骤5:得到最终聚类中心Z,并将各数据对象划分到对应的类簇中。

7.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,基于图像组的聚类方法:采用基于内容的地图服务预览自适应采样方法,为每个图层生成3张预览图,这3张预览图是此图层不同缩放比例信息变化的表达,不管是聚类还是图层推荐,都需要综合每个图层的3张预览图;

把每个图层的3张预览图作为一个图像组,对每个图层的图像组进行聚类,首先解析图像组中3张预览图的特征,3张图像来自于同一个图层不同缩放级别,不同缩放级别的图层是在不同比例尺下对图层相同内容的表达,而同一对象在不同比例尺下的色彩表达不会发生变化;

根据色彩特征对图像组进行聚类时,综合图像组的色彩特征,设3张图像A、B、C的色彩量化统一直方图分别为RA,RB,RC,由于图像组中图像色彩特征的相似性,图像组的色彩特征为R=RA+RB+RC,计算考虑到图像组中图像的特征,综合考虑图像组的色彩特征。

8.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,基于图像组的地图服务推荐:基于图像内容的相似图层推荐综合考虑图层的3张预览图,在此基础上,提出基于地图服务采样图的相似服务推荐方法;

设有图层D与图层E,每个图层各有3张预览图,分别为D1、D2、D3和E1、E2、E3,计算图层D与图层E的采样图像组之间的相似性;考虑到每个图层的3张图像减少由于相似服务定位到不同级别或不同区域引起的两张图像近似度低,提出以下图像组近似度计算方法:第一步:分别计算图像组D1、D2、D3与图像组E1、E2、E3两两之间的图像近似度,采用色彩加纹理特征计算方法,近似度分别为Cji,其中j={1,2,3}为Dj的下标,i={1,2,3}为Ei的下标,假设Cji中的最大值为C11,则在这9组比较中,D1与E1最相似,记C1=C11,排除含有Di和Ei的所有组,即剩下C22、C23、C32、C33;

第二步:同理,C22、C23、C32、C33四组中找出最大值,设为C32,记C2=C32,排除图像D3与图像E2,此时剩下D2与E3这一组图像,记C3=C23;

第三步:经过第一步与第二步之后,两个图像组之间就找到了最相似的三组图像组合方式,为减少由于不同缩放级别和不同位置对相似性的影响,为每一组近似度设置不同的权重值k,最后的图像组之间的近似度为:C=k1×C1+k2×C2+k3×C3其中1≥k1>k2>k3≥0。

9.根据权利要求1所述内容自适应感知的网络地图智能推荐系统,其特征在于,搭建网络地图智能检索推荐平台:包括地理信息服务数据采集、数据处理,关键字检索库与图像特征检索的设计和搭建,搭建一个Web端的网络地图服务关键字检索与相似服务推荐平台,通过网络爬虫爬取大量地图服务解析其元数据存储到数据库并建立关键字检索库,基于Apache Solr发布关键字检索服务,为每个图层采样有代表性的图像,然后计算每幅图像的色彩与纹理特征构建特征库,并通过聚类把聚类结果存储到类别库中,当需要推荐相似图像时,系统首先找到其所在类别,然后在此类别下找出最相似图像所属图层推荐给用户;

(一)地图智能检索推荐平台架构

通过构建网络爬虫采集散落在互联网各个结点的网络地图服务,解析收集到的结构化的网络地图服务数据,存储到数据库中,作为为用户展示的元数据,此外,通过服务提供的图层获取接口,结合网络地图服务缩略图自动生成方法,为每个图层生成缩略图,这些缩略图作为服务内容代表,是后续进行图像特征提取和图像聚类的数据基础,地图智能检索推荐平台框架分为3层:

第1层:网络地图服务采集与预处理层:通过编译网络地图服务主题爬虫,对互联网上散落的地图服务进行抓取,然后依据其服务版本和其规范,对其元数据进行下载解析,基于结构化的组织形式,依据其各个参数信息建立数据库表结构,把处理好的数据存储进MySQL数据库中;

第2层:图像预处理与关键字检索库搭建:本层分为两部分,分别针对平台的关键字检索和相似服务推荐;针对关键字检索,建立从关键字到服务的方向索引库;针对相似服务推荐,为每一个服务生成缩略图;本申请已预定服务的色彩与纹理特征,在后台提前计算出其特征并存储到特征库中,为后续的聚类提供便利;

第3层:平台查询和推荐逻辑实现:实现查询推荐平台的后台逻辑,主要包括:根据关键字的地图服务查询与展示,根据缩略图内容的相似服务推荐;

(二)网络地图数据采集处理

采用开发地理信息服务主题爬虫收集网络上的OGC WMS和ArcGIS MapService,地理信息服务主题爬虫思路和逻辑包括:

(1)通过搜索引擎使用关键字获取种子点URL;

(2)通过编译爬虫程序读取种子点URL网页,从网页中提取获取到的其它URL链接;

(3)解析网页内容,若包含WMS、web map service、ARCGIS REST Services关键字的页面则保留下来作为待处理URL;

(4)若URL链接中包含有service=wms&request=getcappbilities关键字,且页面内中含有wms‑capbilities则确定为OGC WMS服务;若链接中含有/arcgis/rest/services,且页面内容中包含有ArcGIS REST Services Directory,则确定为ArcGIS Service服务,把服务链接存储到数据库中;

抓取的服务已链接的形式存储到数据库中,获得服务的元数据,依照服务发布规范类型和其服务版本,对网页进行请求和元数据解析,只选择其中较重要的信息存储入库。

10.根据权利要求9所述内容自适应感知的网络地图智能推荐系统,其特征在于,(三)地图关键字检索库:建立关键字对服务的反向索引库,建立关键字对服务图层的映射,选择每个服务图层的描述信息和标题两个字段作为关键字匹配的字段;

(1)把WMS和ArcGIS Map Service服务每一个图层的信息看做一个Document,选择每个图层信息中的Title和Description作为待分词的字段,把待索引信息交给Tokenizer组件,通过去标点符号、去停顿次操作得到每一个Document的词元Token信息;

(2)之后交给语言分析工具,把之前得到的词元进行处理,包括大写变小写、单词变为词根形式处理后得到词Term;

(3)把词元Term传给索引器Indexer,将索引后的词元建立单词字典并按字母顺序排序,合并相同的词元Term成为文档倒排链表Posting List;

本申请对象为OGC WMS与ArcGIS MapService两种地图服务,为对服务图层信息进行关键字索引,在其元数据中找到合适的服务描述信息;

建立检索服务通过建立基于词的倒排索引表,英文使用词之间的空格和标点符号进行分隔,检索结果展示信息包括:图层标题、图层描述信息、图层名字、取样图连接,对应的字段分别为mapRiRle、mapAesc、mapMame、images;

关键字检索服务发布:把关键字检索作为一个单独的服务进行发布,使关键字检索服务从整个系统中解耦,选择Tomcat作为solr服务的发布服务器,服务发布成功后通过可视化的web页面查看Solr中的信息,通过在页面配置查询条件查询到检索结果,把服务整合到平台中采用SolrJ工具,调用Solr搜索服务。