1.一种大数据信任评估方法,其特征在于,所述方法包括:
通过信任收集器收集大数据提供商下的数据源的可信度并存储在信任值数据库;
获取大数据需求商通过信任评估代理发送的对特定数据源的可信度查询请求;
基于可信度查询请求查询信任值数据库是否存储有对特定数据源的可信度;
在信任值数据库未存储有待查询的特定数据源的可信度的情况下,对邻居信任处理代理发送查询请求;
接收由邻居信任代理反馈的可信度;
在信任值数据库存储有待查询的特定数据源的可信度的情况下,直接获取对特定数据源的可信度;
将获取到的可信度发布至大数据需求商的信任评估代理;
其中,所述邻居信任处理代理表示可信任的信任处理代理,信任处理代理之间通过生产消费关系建立邻居关系。
2.如权利要求1所述的一种大数据信任评估方法,其特征在于,所述通过信任收集器收集大数据提供商下的数据源的可信度并存储在信任值数据库包括:在t时刻接收到的新的对直接管理数据源的可信评价;
将在t时刻接收到的新的对直接管理数据源的可信评价按直接管理数据源对应的评价属性存储至信任值数据库后,读取信任值数据库存储的直接管理数据源的评价属性及评价属性对应的可信评价;
基于在信任值数据库读取的直接管理数据源的评价属性及评价属性对应的可信评价对直接管理数据源的直接可信度进行计算;
删除原存储在信任值数据库的对直接管理数据源的直接可信度后将所述计算结果作为直接管理数据源的直接可信度替代存储至信任值数据库。
3.如权利要求2所述的一种大数据信任评估方法,其特征在于,所述基于在信任值数据库读取的直接管理数据源的评价属性及评价属性对应的可信评价对直接管理数据源的直接可信度进行计算包括;
基于在信任值数据库读取的对直接管理数据源的可信评价及对直接管理数据源的可信评价的评价属性获取对直接管理数据源的可信评价的评价属性对应的mass函数;
基于对直接管理数据源的可信评价的评价属性、对直接管理数据源的可信评价的评价属性对应的mass函数及对直接管理数据源的可信评价的评价属性对应的评价值对所述mass函数进行调整;
通过对调整后的mass函数进行证据合成并基于证据合成的结果对直接管理数据源的直接可信度进行计算;
其中,所述mass函数为直接管理数据源对应的基于D-S证据理论的识别框架的焦元的基础概率函数,所述评价属性用于确定所述直接管理数据源是否可信并具体包括数据规范性、数据项空值频率、数据到达率、数据源性能,所述对直接管理数据源的评价具体为对直接数据源的评价属性的评价,所述信任值数据库存储有至少四个评价属性及每个评价属性对应的至少两个mass函数;
其中,所述对直接管理数据源的可信评价包括数据源的客观属性及大数据需求商对数据源的主观评价。
4.如权利要求3所述的一种大数据信任评估方法,其特征在于,所述基于对直接管理数据源的可信评价的评价属性、对直接管理数据源的可信评价的评价属性对应的mass函数及对直接管理数据源的可信评价的评价属性对应的评价值对所述mass函数进行调整包括:基于对直接管理数据源的可信评价的评价属性和对直接管理数据源的可信评价的评价属性对应的评价值获取每个评价属性的信息熵;
根据信息熵计算每个评价属性的指标权重;
通过每个评价属性的指标权重对直接管理数据源对应的mass函数进行调整。
5.如权利要求4所述的一种大数据信任评估方法,其特征在于,设Hj为第j个评价属性的信息熵,则所述信息熵为其中,p为信任值数据库存储的所述直接管理数据源的被评价次数,aij为信任值数据库存储的对所述直接管理数据源的第i次评价中对第j个评价属性的评价值,vcpu为第i次评价时CPU利用率,vram为第i次评价时数据源所在服务器的内存总量,vuram为第i次评价时数据源所在服务器的内存使用量,vio为第i次评价时磁盘吞吐率,vnet为第i次评价时数据源所在服务器的网络带宽,vunet为第i次评价时数据源所在服务器已使用的网络带宽,n表示有n个用户参与评价,sl为第i次评价时第l个用户对第j个属性的主观评分,且sl∈[0,100],在fij=0时,令fijlnfij=0。
6.如权利要求5所述的一种大数据信任评估方法,其特征在于,设ωt(j)为评价属性的指标权重,则所述评价属性的指标权重为其中,所述q为信任值数据库存储的所述直接管理数据源的被评价的评价属性的个数。
7.如权利要求6所述的一种大数据信任评估方法,其特征在于,设mj(A)为未调整过的mass函数,m′j(A)为mj(A)调整后的mass函数,则所述通过每个评价属性的指标权重对直接管理数据源对应的mass函数进行调整具体为:U(mj)=ωt(j);
其中,Θ为D-S证据理论中的识别框架,A为所述识别框架中的焦元,所述mj(A)为焦元A对应的未调整的mass函数,所述m′j(A)为调整后的焦元A对应的mass函数,B为包含至少一个焦元的集合,在所述mj(A)由于不止一次的评价而导致mj(A)的取值无法确定的情况下,仅将最新的一个评价数据作为mj(A)来计算m′j(A),且:所述m’ij、m”ij、m”’ij分别表示第i次评价的第j个评价属性为识别框架中焦元A对应的可信任/不可信/不确定的基础概率函数。
8.如权利要求7所述的一种大数据信任评估方法,其特征在于,所述通过对调整后的mass函数进行证据合成计算后输出直接管理数据源的直接可信度包括:基于对调整后的mass函数获取归一化所需的K值;
基于所述K值、识别框架中的焦元及调整后的mass函数,计算每个评价属性的用于评价可信度的信任函数和似然函数;
基于信任函数和似然函数计算直接管理数据源的直接可信度;
其中,设Bel(A)为信任函数,Pl(A)为似然函数,对于信任函数和似然函数的定义为:在识别框架Θ上基于mass函数的信任函数定义为:
所述在识别框架Θ上基于mass函数的似然函数定义为:
其中,所述识别框架Θ上的mass函数满足2Θ→[0,1]且
9.如权利要求8所述的一种大数据信任评估方法,其特征在于,所述方法还包括:接收大数据需求商对特定数据源的综合可信度的获取请求;
基于对特定数据源的获取请求,计算特定数据源的推荐可信度并在信任数据库中查询结果;
在信任数据库未存储有大数据需求商所请求获取的特定数据源的直接可信度时,通过邻居信任处理代理的链接信息对信任传播网络内的其他信任处理代理进行遍历以获取遍历结果;
根据遍历结果计算特定数据源的间接可信度并根据特定数据源的间接可信度和特定数据源的推荐可信度计算特定数据源的综合可信度;
在信任数据库存储有大数据需求商所请求获取的特定数据源的直接可信度时,根据特定数据源的直接可信度和特定数据源的推荐可信度计算特定数据源的综合可信度;
其中,所述间接可信度是通过遍历获取的其他数据源所存储的直接可信度进行计算的,所述推荐可信度则表示特定数据源所处的大数据网络对特定数据源的评价,所述信任传播网络由相互之间存在邻居关系的至少两个信任处理代理组成。
10.如权利要求9所述的一种大数据信任评估方法,其特征在于,所述根据遍历结果计算特定数据源的间接可信度并根据特定数据源的间接可信度和特定数据源的推荐可信度计算特定数据源的综合可信度包括;
根据遍历结果确认从其他信任处理代理处获取到的特定数据源的直接可信度及特定数据源的直接可信度的获取路径并根据特定数据源的直接可信度及特定数据源的直接可信度的获取路径计算特定数据源的间接可信度;
根据特定数据源的间接可信度和特定数据源的推荐可信度计算特定数据源的综合可信度;
其中,设在t时刻,所述所述综合可信度为T,直接可信度为Td(t),间接可信度为Ti(t),推荐可信度为Tr(t),则其计算方式为:所述综合可信度为:
其中, 所述t表示在信任计算器计算
综合可信度T的时刻;
所述直接可信度通过可能性计算公式进行计算,具体为:
对于直接可信度Td(t)而言,命题A应为框架内的信任焦元{T},综上所述,直接可信度Td(t)的计算方式为:其中,|{T}|=1,|{T,-T}|=2,|A|表示焦元A所包含的元素数量,|Θ|表示识别框架Θ所包含的元素数量,,所述识别框架Θ包括信任{T}、不信任{-T}、不确定{T,-T}这3个焦元,{-T}表示特定数据源为不可信任的,{T}表示特定数据源为可信任的,{T,-T}表示特定数据源为不确定是否可信任的;
所述间接可信度为:
其中,Px(t)表示信任收集器获取到特定数据源的直接可信度的第x条路径的衰减可信度,Txy表示第x条路径上第y个信任处理代理的信用传递的衰减程度,Txy(t)=axy,axy表示第x条路径上第y个信任处理代理的衰减系数, 表示信任的聚合算法或表示算术平均, 表示信任处理代理之间的直接可信度的传递;
所述推荐可信度为:
其中,设F表示待验证的特定数据源,PRF(t)表示t时刻数据源F在大数据生产消费关系网络中的排名值PR,Tr(t)是大数据数据源F的推荐值,且是数据源F排名值PRF(t)的归一化结果。PRmax(t)和PRmin(t)分别代表t时刻大数据生产消费关系网络中的最大排名值和最小排名值。