1.一种针对物联网数据的自动语义标注系统,其特征在于:包括物联网传感器数据预处理模块、物联网领域本体模块、数据RDF处理模块和语义标注模块;
所述物联网传感器数据预处理模块用于对传感器数据进行分析预处理,对感知数据进行格式和位置分析,并使用聚类算法挖掘数据中隐含的知识信息;
所述物联网领域本体模块用于表示物联网中传感器节点数据的语义概念和概念的属性、关系;
所述数据RDF处理模块用于将经过预处理的物联网传感器数据流格式化成本体中的数据形式,即转换成包含语义信息的RDF格式数据;
所述语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性。
2.根据权利要求1所述的针对物联网数据的自动语义标注系统,其特征在于:所述物联网传感器数据预处理模块使用KMA聚类算法,将数据降维处理并挖掘出数据中隐含的知识信息,最终将数据输出为JSON格式。
3.根据权利要求2所述的针对物联网数据的自动语义标注系统,其特征在于:所述KMA聚类算法,该算法基于k‑modes和蚁群聚类两种机器学习算法改进,具体算法步骤如下:
1)任意选择k个对象作为初始聚类中心;
2)将每个对象指定给最相似的中心;
3)更新集群质心;
4)合并集群质心;
5)返回到步骤2),直到质心不再更改为止;
6)对每个数据对象到相应的聚类中心K分配初始不同的信息素ω,保证簇中各样本路径上的信息素要多于各簇之间的信息素;
7)根据路径上的信息素计算蚂蚁转移概率,将数据分类到相似簇中;
8)完成一次遍历后,信息素更新迭代;
9)当最小距离不再变化或者达到设定的迭代次数时,算法终止,输出最优聚类结果;
此过程完成数据分类处理并挖掘出数据中隐含的知识信息,最终输出JSON格式文档。
4.根据权利要求1所述的针对物联网数据的自动语义标注系统,其特征在于:所述物联网领域本体模块是基于传感器网络本体SSN的相关概念和关系,并结合具体的物联网环境,添加额外的概念、属性和关系集合,所构建的物联网领域本体是针对物联网数据的知识集合。
5.根据权利要求4所述的针对物联网数据的自动语义标注系统,其特征在于:所述构建物联网领域本体,包括以下步骤:确定领域概念;
建立概念的数据类型属性;
建立概念间的父子类关系;
建立概念与概念间的关系;
建立概念的实例,确定实例间的关系;
形成本体的逻辑体系结构。
6.根据权利要求1所述的针对物联网数据的自动语义标注系统,其特征在于:所述数据RDF处理模块采用RDF转换算法,将经过预处理输出JSON格式文档中的数据转换为具有主语、谓语和宾语形式的RDF三元组。
7.根据权利要求1所述的针对物联网数据的自动语义标注系统,其特征在于:语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性;SWRL语言中定义的规则遵循语法形式为: 其中consequent用于标记概念和属性以及实现先行规则的预期名称。
8.根据权利要求7所述的针对物联网数据的自动语义标注系统,其特征在于:语义标注模块首先解析物联网领域本体,将物联网领域本体中定义的概念、属性和关系作为语义标注规则基准信息集,根据该基准信息集对聚类分析后包含知识信息的RDF三元组数据,使用SWRL语言标记聚类结果中提取的未命名概念和属性,并将语义信息实时集成到物联网环境中的异构传感器流数据中,从而实现自动语义标注,最终将标注后的数据存入AllegroGraph图形数据库并更新本体。