利索能及
我要发布
收藏
专利号: 2010102740854
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:无效专利
更新日期:2026-01-15
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种SOA多消息机制的异构数据集成系统,其特征在于:该系统包括:消息引擎服务模块、语义映射服务模块、数据访问服务和数据控制服务模块,消息引擎服务模块包括:抽象消息工厂模块、具体消息工厂模块、抽象消息对象、具体消息对象,抽象消息对象是处理客户端消息的一个接口,抽象消息工厂模块包含对所有消息的抽象和创建,通过一个接口提供消息对象,具体消息对象和具体消息工厂继承抽象层的方法和属性,消息引擎服务模块根据客户端消息请求的格式,判断消息类型,并创建与之对应的消息对象,消息引擎服务模块根据消息对象对接收的消息进行分解和重组,对重组消息采用XML语言描述,并将其发送给语义映射服务模块处理;语义映射服务模块:接收来自消息引擎服务模块发送的标准消息,调用词汇相似度算法并结合语义匹配方法把查询分解成可执行的子查询语句,把与请求查询相似的词汇提取出来,并形成映射本体文件,针对每个数据源建立局部视图,然后根据查询请求建立全局视图,并根据OWL语言的规则,建立全局视图和局部视图之间关系,读取映射本体文件中相似词汇的集合,将全局查询转换为可执行的子查询,再把子查询提交给数据访问服务和数据控制服务模块处理;数据访问服务模块接收子查询语句,形成一个包装器,经过包装器对各种数据库访问处理,形成一系列XML结果集,再由数据控制服务模块处理优化,获得数据集成信息;其中,语义映射过程的步骤包括:加载OWL映射文件并遍历类节点;获得类节点的所有属性,与关键字信息匹配;遍历类节点的所有子类节点,子类节点属性与关键字信息进行匹配,提取关键字的等价类,获得等价属性,分解全局概念,获得分查询进行存储;所述词汇相似度算法包括:利用本体元素密度因子和义原上下位关系、或基于本体概念相关性、或基于关系义原、或结合前三种策略的混合策略计算本体中的词汇相似度,其中,基于混合策略中根据义原上下位关系、本体概念相关性和基于关系义原的权值获得概念相似对。

2.根据权利要求1所述的异构数据集成系统,其特征在于:基于本体元素密度因子和义原上下位关系,所述词汇相似度算法具体为语义映射服务模块调用公式:

sim2(c1,c2)=sim1(p1,p2)×(M1+M2)计算词汇c1和c2之间的相似度,其中,p1和p2为c1和c2的第一义原,M1为本体元素属性因子,M2为概念实体因子。

3.根据权利要求1所述的异构数据集成系统,其特征在于:基于关系义原的策略,所述词汇相似度算法具体为语义映射服务模块调用公式: 计

算词汇c1和c2之间的相似度,其中,d1i∈W(c1),d2j∈W(c2),且W(c1)和W(c2)分别为词汇c1和c2关系义原的集合。

4.根据权利要求1所述的异构数据集成系统,其特征在于:基于混合策略,所述词汇相似度算法具体为语义映射服务模块调用公式:sim(c1,c2)=αsim2(c1,c2)+βsim3(c1,c2)+χsim4(c1,c2),计算词汇c1和c2之间的相似度,其中α为基于本体元素密度因子和义原上下位关系的权值因子、β为基于本体概念相关性的权值因子、χ为基于关系义原的权值因子,且有α+β+χ=1,0<χ≤β≤α<1,0≤sim(c1,c2)≤1。

5.一种SOA多消息机制的异构数据集成方法,其特征在于:包括步骤:由多种客户端异构平台组成的查询接口,向消息引擎服务模块各自发送客户端自己的消息请求;消息引擎服务模块中抽象消息工厂模块包含对所有消息的抽象和创建,通过一个接口提供消息对象,具体消息对象和具体消息工厂继承抽象层的方法和属性,消息引擎服务模块根据客户端消息请求的格式,判断消息的类型,并创建与之对应的消息对象,根据消息对象对接收的消息进行分解和重组,对重组消息采用XML语言进行描述,并将其发送给语义映射服务模块处理;语义映射服务模块接收来至消息引擎服务模块发送的标准消息,调用词汇相似度算法并结合语义匹配方法把查询分解成可执行的子查询语句,把与请求查询相似的词汇提取出来,并形成映射本体文件,针对每个数据源建立局部视图,然后根据查询请求建立全局视图,并根据OWL语言的规则,建立全局视图和局部视图之间关系,读取映射文件中相似词汇的集合,将全局查询转换为可执行的子查询,再把子查询提交给数据访问服务和数据控制服务模块处理;数据访问服务模块接收子查询语句,形成一个包装器,经过包装器对各种数据库访问处理,形成一系列XML结果集,再由数据控制服务模块处理优化,获得数据集成信息;其中,语义映射过程的步骤包括:加载OWL映射文件并遍历类节点;获得类节点的所有属性,与关键字信息匹配;遍历类节点的所有子类节点,子类节点属性与关键字信息进行匹配,提取关键字的等价类,获得等价属性,分解全局概念,获得分查询进行存储;所述词汇相似度算法包括:利用本体元素密度因子和义原上下位关系、或基于本体概念相关性、或基于关系义原、或结合前三种策略的混合策略计算本体中的词汇相似度,并建立映射文件,其中,基于混合策略中根据义原上下位关系、本体概念相关性和关系义原的权值获得概念相似对。

6.根据权利要求5所述的异构数据集成方法,其特征在于:基于本体元素密度因子和义原上下位关系,所述词汇相似度算法具体为语义映射服务模块调用公式:

sim2(c1,c2)=sim1(p1,p2)×(M1+M2)计算词汇c1和c2之间的相似度,其中,p1和p2为c1和c2的第一义原,M1为本体元素属性因子,M2为概念实体因子。

7.根据权利要求5所述的异构数据集成方法,其特征在于:基于关系义原的策略,所述词汇相似度算法具体为语义映射服务模块调用公式: 计

算词汇c1和c2之间的相似度,其中,d1i∈W(c1),d2j∈W(c2),且W(c1)和W(c2)分别为词汇c1和c2关系义原的集合。

8.根据权利要求5所述的异构数据集成方法,其特征在于:基于混合策略,所述词汇相似度算法具体为语义映射服务模块调用公式:sim(c1,c2)=αsim2(c1,c2)+βsim3(c1,c2)+χsim4(c1,c2),计算词汇c1和c2之间的相似度,其中α为基于本体元素密度因子和义原上下位关系的权值因子、β为基于本体概念相关性的权值因子、χ为基于关系义原的权值因子,且有α+β+χ=1,0<χ≤β≤α<1,0≤sim(c1,c2)≤1。