利索能及
我要发布
收藏
专利号: 2022102768354
申请人: 南京师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种大数据探索性标签地图的生成方法,其特征在于,该方法设计四种大数据探索性标签地图的生成模式,将位于同一区域内的标签视为一类,将关注同一区域内的标签属性变化的可视化任务称为类内任务,关注多个区域之间的标签属性变化的可视化任务称为类间任务;将空间维度分为全局区域和局部区域,将属性维度分为类内和类间,将空间和属性维度进行两两组合,设计全局类内、局部类内、全局类间、局部类间四种大数据探索性标签地图生成模式,分别适应不同文本信息的探索性分析场景:(a)全局类内模式,适应场景为:通过浏览全局区域中各个区域的标签,快速地识别出各个区域中最显著的标签,分别获得各个区域的主要信息;

(b)局部类内模式,适应场景为:对特定兴趣区中的标签进行详细的分析,获得各个标签的详细内容和频率排序;

(c)全局类间模式,适应场景为:关注特定主题的标签,快速和准确地在全局区域中搜索到与特定主题相关的标签;

(d)局部类间模式,适应场景为:提取不同区域中具有代表性的标签并进行比较,发现不同区域之间的标签的相似性和差异性;

该方法具体包括如下步骤:

步骤1,获取标签和地理区域范围;

步骤2,指定大数据探索性标签地图生成模式;

步骤3,确定初始位置;

步骤4,位置有效性检测;

步骤5,放置标签。

2.根据权利要求1所述的大数据探索性标签地图的生成方法,其特征在于,所述步骤1具体包括:

(1.1)获取标签和地理区域范围数据;

(1.2)设置标签的大小范围,设置最大标签Smax 和最小标签 Smin,选择标签颜色、标签字体类型、标签旋转方向的视觉变量。

3.根据权利要求1所述的大数据探索性标签地图的生成方法,其特征在于,所述步骤2具体包括:

(2.1)对于全局类内模式,计算标签在其关联的地理区域中出现的频率,获取每个标签T在各自关联的区域中的降序排序的序号;

(2.2)对于局部类内模式,指定兴趣区,计算标签在该区域中出现的频率,获取该区域中每个标签T的降序排序的序号;

(2.3)对于全局类间模式,指定标签的主题和数量M,计算标签在其关联的区域中出现的频率,获取每个标签T在全局区域所有标签中的降序排序的序号,保留前M个标签;

(2.4)对于局部类间模式,确定一个或多个兴趣区,计算每个标签在各自关联的区域中出现的频率f和在全局所有区域中出现的频率F,计算 ,获取在兴趣区中每个标签T的降序排序的序号。

4.根据权利要求1所述的大数据探索性标签地图的生成方法,其特征在于,所述步骤3具体包括:

(3.1)根据步骤2中标签的计算结果,将标签大小S标准化为Smin — Smax范围之间;

(3.2)选择排序列表中的第一个标签t1,将第一个标签放置在其相关联的区域的中心。

5.根据权利要求1所述的大数据探索性标签地图的生成方法,其特征在于,所述步骤4具体包括:

(4.1)如果t1位置有效,即标签完全在其相关联的区域内,放置标签;

(4.2)如果位置发生冲突,即标签不完全在区域内,将标签沿着螺旋线布局方式向外移动,寻找有效的位置;

(4.3)如果没有找到有效的位置,减小标签大小或删除标签不进行显示。

6.根据权利要求1所述的大数据探索性标签地图的生成方法,其特征在于,所述步骤5具体包括:

(5.1)沿着螺旋线布局方式向外移动放置下一个标签;

(5.2)如果位置无效,即该标签与其他标签交叉或不完全在其关联的区域内,将标签沿着螺旋线布局方式继续向外移动,寻找有效的位置,既不与其他标签交叉,又完全在其关联的区域内;

(5.3)如果没有找到有效的位置,减小标签大小或删除标签不进行显示;

(5.4)重复(5.1)、(5.2)、(5.3)步骤,并确定剩余标签的数量N,如果N = 0,则算法结束,生成大数据探索性标签地图。