利索能及
我要发布
收藏
专利号: 2017103941778
申请人: 海南大学
专利类型:发明专利
专利状态:已下证
更新日期:2024-11-12
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于数据图谱、信息图谱和知识图谱的处理架构资源可动态抽象的语义建模方法,其特征在于对需求进行语义建模时减少数据冗余和不一致,增强模型设计的内聚性,提高开发效率,具体步骤如下:步骤1)获取服务软件开发需求描述,开发服务软件的需求由一个或多个客户来描述,多源的需求存在冗余性和不一致性,开发者以研究的方式收集用户的需求,用户群体会非常大,用户对需求的描述将会非常混乱;

步骤2)基于步骤1得到的需求描述,提取关键词并将关键词以结点的形式表达在数据图谱上,记录每种关键词出现的结构频度Str_f、时间频度Tem_f和空间频度Spa_f,定义结构频度为数据出现在不同数据结构中的次数,限定每次计算在内的数据结构必须是数据所在最大数据结构,以图结构中树结构出现的频度按图结构计算,不再计算树结构的频度,时间频度为数据在不同时间出现的次数,空间频度被定义为数据在不同空间位置出现的次数;

步骤3)基于步骤2中记录的数据的结构频度、时间频度和空间频度,根据公式1计算数据的总频度frequency:步骤4)基于步骤3得到的数据的总频度,根据公式2和公式3计算数据在数据图谱上的支持度support(ri)和置信度confidency以删除错误或无用数据,其计算公式为frequency()=Str_f()*Tem_f()*Spa_f(),frequencyDG表示数据图谱上所有结点的频度总和,删除数据的条件是必须同时满足支持度和置信度的阈值要求,阈值过大不利于图谱表达的准确性,过小会不利于表达的完整性,根据计算图谱反馈的结果信息动态调整:frequency(ri)计算公式为:

frequency(E1, E2)计算公式为:

步骤5)基于步骤4)得到的数据图谱,由领域专家或学者对现有数据进行清洗,统一含义相同但表达方式不同的数据,减少小频率出现的数据;

步骤6)基于步骤5得到的信息图谱,根据公式4计算实体间交互的频度,实体间交互的频度表示实体间交互的次数,P表示实体之间所有完整的交互路径:  (4)

步骤7)基于步骤6得到的信息图谱,根据公式5计算有交互关系的多个实体的综合频度Total_frequency, FrequencyDG表示存在交互关系的实体在数据图谱上频度之和,FrequencyIG表示实体在信息图谱上的交互频度,α和β是数据图谱频度和信息图谱频度所占权重,由训练得出:步骤8)基于步骤7得到的信息图谱,计算连通结点的内聚性,根据公式6将实体内聚性确定为内部交互度和外部交互度的比值,DegreeEI表示圈定范围后的实体集与外部实体之间的交互, DegreeII表示圈定实体之间的内部交互,在外部交互度和内部交互度的计算中,忽略了实体之间的关系方向,计算多次后将具有最大cohesion的不同连通实体以属性和操作的形式集成到同一模块中,在信息图谱上以新结点的形式表达,增强模型的内聚性并提高抽象度:步骤9)基于步骤8得到的信息图谱,转到数据图谱上标记新产生的结点的结构频度、时间频度和空间频度;

步骤10)基于步骤9)得到的信息图谱,完善实体之间的语义关系,原子服务之间存在选择关系、序列关系、并行关系和互斥关系以及“与”,“或”,“异或”,“非”逻辑关系,在知识图谱上能通过信息推理和实体链接提高知识图谱的边密度和结点密度,知识图谱的无结构特性使得其自身可以无缝链接,信息推理需要有相关关系规则的支持,通过推理得到的新关系的正确度Cr根据公式7进行计算,P表示实体1和实体2之间的一条路径,Q表示所有路径,θ(π)表示训练权重,当正确度超过某一设定阈值时认为该关系成立;

   (7)。