1.一种基于博弈模型的车联网的节点激励方法,其特征在于,包括以下步骤:步骤1:建立车联网网络的相邻节点的单阶段博弈模型,后延伸建立无限重复博弈模型;
步骤2:在步骤1中重复博弈模型,以及针锋相对策略的基础之上,节点之间采用容错性的策略;
步骤3:以节点的信誉值为基础,对贡献度高的节点进行奖励,对贡献度低的节点进行惩罚,改善了节点之间贡献度不一致的问题,使得所有节点的积极性得到提高;
所述步骤1中,整个车联网网络G(V,E)由N个理性节点构成,G表示任意连通图,V表示节点的集合,E表示链路集合;系统时间由一个个离散时隙t构成的,在每个时隙中,节点都可以做出理性的选择;所述无限重复博弈模型具体为,使每一个节点之间进行多次交互,互相合作进行数据包转发,从而提高车联网的整体网络性能;
所述步骤2中容错性策略具体为:对于车联网中存在一对相邻节点A和B,对其中任一节点采取策略如下:初始阶段:节点A和节点B的态度都是友好的,即采取合作的态度,积极转发对方的数据包;
容忍阶段:当第k个时隙,节点A采取不合作的态度,那么在一定时间内,设容忍时间为T,节点B采取容忍的态度,即依然为节点A转发数据包;
判断阶段:如果容忍阶段过后,节点A的态度仍然不友好,即选择不合作行为,那么节点B会将节点A广播出去,告知其他节点,然后节点A进入惩罚期,设为P;
惩罚阶段:在惩罚期内,其他节点都会拒绝转发节点A发送的数据包,并且节点A在惩罚期内必须帮助其邻居节点无偿转发数据包;
遗忘阶段:当惩罚阶段结束,节点A可以重新进入网络,其不合作历史也会被遗忘;
容忍时间T和惩罚期P的值具体按照以下规则确定:
首先确定容忍时间T,容忍时间T内,节点B始终选择合作策略,但是邻居节点A采取不合作的态度,根据博弈论的知识,容忍阶段中,节点B的收益fB如下式:其中δ为贴现因子,其取值范围为(0,1),它被视为节点合作的耐心程度,δ值越大,则节点表现的越耐心,β表示节点转发数据产生的消耗;
在此期间,节点B一直无偿地为节点A转发数据,但是自身的数据并没有被转发,要使得T成立,则需要使节点B的期望收益UB大于等于零,即:也就是说,容忍时间T的值就是使上式成立的值,α为节点发送数据被邻居节点转发而获得的收益;
最后确定惩罚期P的值,由于节点A从第k个时隙开始,经历了容忍时间之后,仍然不合作,所以对节点A施加惩罚,如果容忍阶段获得的利益小于惩罚期的消耗,由于节点都是理性的,所以从下一个阶段开始,为了最大化自身的利益,节点的态度会从不合作转为合作,见下式:满足上式,对应的就是惩罚期P的值;
所述步骤3中的基于信誉值的奖励和惩罚机制具体为:
初始化阶段,每个节点自身都包含一张权值表,将权值的初始值初始化为0,当节点每参与转发一次,权值加1;
每个时隙t内,表都会更新一次,并且将各节点按照权值的大小排序;
当节点B和节点C都要求节点A转发各自的数据包时,节点A会根据权值表中权值的大小,优先转发权值大的节点的数据包,之后再转发权值小的节点的数据包;
计算所述节点的预期的总收益的方法为:
其中, 代表节点i在时隙t单阶段博弈的收益,δ为贴现因子,其取值范围为(0,1),它被视为节点合作的耐心程度,δ值越大,则节点表现的越耐心,也越重视长期利益;反之,则节点越注重眼前的利益。