利索能及
我要发布
收藏
专利号: 2023102397607
申请人: 南京师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于,所述方法包括如下步骤:S1:抽取历史地图集中地理实体与实体的属性,计算地理实体间空间关系;

S2:按照点、线和面实体分类,分别计算地理实体演变的几何、属性和空间关系相似度特征;

S3:提出基于自然梯度提升的地理演变过程中实体对齐的判断方法,结合地理实体演变的各相似度特征,进行历史序列地图的地理实体对齐;

S4:使用统一性的解释框架可视化特征关系,分析NGBoost地理实体对齐计算中各相似度特征的贡献度,增加NGBoost模型透明度;

S6:根据点、线和面实体类型的1对1、1对多和多对1对齐类型,设计地理实体时空演变的自然语言规则,定义地理时空演变的知识四元组,抽取地理实体时空演化关系知识四元组;

S7:使用Neo4j图数据库工具,构建地理时空演化知识图谱;

其中,所述步骤S4中,使用SHAP模型,辅助理解NGBoost集成学习模型输入特征值对于对齐结果的贡献,SHAP的特征重要性依靠Shapley值来衡量,其值的绝对值越大,表示该特征对模型预测值的影响越大,其正负则代表影响的方向,Shapley值的特征如下:,

式中, 为特征向量 中特征的数量, 指特征 的Shapley值,用于表示该特征的贡献; 表示为平均贡献值; 表示该特征是否存在,取值为0或1; 代表预测模型;代表解释模型。

2.根据权利要求1所述的一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于:所述步骤S1中,抽取历史地图集中的地理实体与实体属性,计算地理实体间空间关系,其中抽取的实体包括行政区、城市和河流,抽取的实体的属性包含基本信息、位置、大小和地理类型;计算的空间关系包括方位、距离和拓扑关系。

3.根据权利要求1所述的一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于:所述步骤S2中,对点、线和面三种不同类型实体,分别计算地理实体演变的几何、属性和空间关系相似度特征,其中几何相似度特征包括大小相似度和形状相似度;属性相似度特征包括语义相似度;空间相似度特征包括距离相似度和拓扑相似度,将地理实体时空演变关系抽取问题转化为地理实体对齐判断。

4.根据权利要求1所述的一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于:所述步骤S3中,结合地理实体演变的各相似度特征,采用NGBoost集成学习方法,进行不同时期地理实体对齐判断,使用概率来预测地理实体对齐的不确定性。

5.根据权利要求1所述的一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于:所述步骤S6中,结合地理实体时空演变特征,设计演化关系谓词用于连接对齐的不同时期实体对,定义点、线和面不同类型地理实体时空演化的自然语言规则,建立对齐的不同时期实体的演化关系和自然语言描述对照关联词典,构建地理实体演变的知识四元组,将地理实体演化知识表达为四元组形式,地理知识四元组具体形式如下:,

式中,Entity1为对齐的T1时期实体,Entity2对齐的T2时期实体;R为两对齐实体的演化关系。

6.根据权利要求1所述的一种基于NGBoost的地理时空知识抽取和图谱表示方法,其特征在于:所述步骤S7中,使用Neo4j图数据库工具,利用所抽取的地理知识四元组,构建地理实体时空演变知识图谱,直观地显示所获得的国家与郡县、河流之间的空间关系及时空演变关系。