1.一种基于长短休眠周期的基站关断机制,其特征在于:该机制主要包括:
1):将基站分为激活模式和睡眠模式,在睡眠模式中又分为深度睡眠模式和轻度睡眠模式,并且假设基站初始状态为激活模式;将每个模式用周期表示,基站在睡眠周期中首先处于深度睡眠周期,紧接着是轻度睡眠周期;
在每一段时间结束后,都需要对基站的模式进行判断:如果基站处于激活模式,则基站将保持最大发射功率;如果基站处于深度睡眠模式,则基站处于休眠状态,此时基站不处理任何业务,能耗最低;如果基站处于轻度睡眠模式,则基站会处理业务,但是其发射功率相对激活模式要低一些;激活模式和睡眠模式之间的转换需要做出判断后执行,由激活模式转换到睡眠模式需要在连续一段时间τ内没有业务到达,由睡眠模式转换到激活模式则需要在连续k个睡眠周期内到达的业务数量都较多;如果基站处于睡眠模式,则将每个睡眠模式用睡眠周期表示,并且由深度睡眠周期和轻度睡眠周期组成,基站在睡眠周期中优先进入深度睡眠周期,然后才进入轻度睡眠周期,每个睡眠周期都是如此;
2):将每个睡眠周期分成长睡眠周期和短睡眠周期,通过感知业务数量来决定基站关断时长周期的长短;
3):在2)中确定了基站关断时长后,进一步使用增强学习方法(Q-learning)来优化基站休眠周期长度。
2.根据权利要求1所述的一种基于长短休眠周期的基站关断机制,其特征在于:在2)中将基站的睡眠周期分成两种,即长睡眠周期和短睡眠周期,但是每个睡眠周期仍然由深度睡眠周期和轻度睡眠周期组成;同时,需要感知在每个睡眠周期中到达的业务数量,以决定下个睡眠周期中基站的关断时长;在每个睡眠周期中,当业务到达较少或没有业务到达时,下一个睡眠周期中深度睡眠周期的时长将处于短睡眠周期,并且轻度睡眠周期的时长保持不变,如果连续k个睡眠周期到达的业务数量都没有或者较少时,那么第k+1个周期将变成长睡眠周期;当业务到达较多时,下一个睡眠周期中深度睡眠周期的时长将保持不变,并且轻度睡眠周期的时长将适当的延长,以保证处理完当前深度睡眠周期中到达的业务;如果在长睡眠周期内到达的业务数量较多的时候,则下一个睡眠周期又将转变成短睡眠周期。
3.根据权利要求1所述的一种基于长短休眠周期的基站关断机制,其特征在于:在3)中使用增强学习方法(Q-learning),以队列时延作为约束条件,根据实时到达的业务对基站休眠周期长度进行动态调整;当业务到达数量较少时,轻度睡眠周期将不会被充分利用,此时,如果满足事先规定的时延,那么就可以在原有的短睡眠周期和长睡眠周期的基础上延长睡眠时间,从而实现最大化节能;在使用增强学习方法时,需要观测当前周期内第一个业务到达的时间,这个时刻加上之前规定好的时延同当前周期内睡眠周期的时长进行对比,如果前者大于等于后者,那么做出适时调整即延长当前周期内的深度睡眠时长,反之则保持原有深度睡眠时长不变。
4.根据权利要求3所述的一种基于长短休眠周期的基站关断机制,其特征在于:所述增强学习方法(Q-learning)具体包括:1)将基站的每个周期都抽象为一个状态所对应的时间间隔;2)业务模型采用离散马尔科夫调制泊松过程(discrete-time Markov-modulated Poisson Process,dMMPP),每一个状态都用业务的到达率表示,并且不同的状态其业务的到达率不同,每种状态都是服从泊松分布;3)用每个周期内基站的关断时长作为基站采取的行动,基站会在每个周期末采取相应的行动,该行动决定了下个周期内基站的关断时长,同时系统转移到下一个状态;4)以能耗为优化目标,以队列时延作为约束条件,采用动态规划的方法,求解出使得能耗最低的每个状态下的关断时长。
5.根据权利要求4所述的一种基于长短休眠周期的基站关断机制,其特征在于:在所述增强学习(Q-Learning)方法中,由3个多元组组成{S、A、R},其中S表示系统状态集合,A表示行动集合,R表示回报函数,将基站的每一个周期都抽象为一个状态所对应的时间间隔。
6.根据权利要求5所述的一种基于长短休眠周期的基站关断机制,其特征在于:状态采用不同到达率的业务表征,并且需要事先定义好每个状态之间的转移概率,这个转移概率通过统计一段时间内的状态变化情况得到;系统的行动用基站的关断时长表征,基站在每个周期末采取相应的行动,该行动决定了下个周期内基站的关断时长,同时系统转移到下一个状态。