1.一种多轿厢电梯控制方法,其特征在于,包括:
获取各个用户体重,将各个用户体重相加获得体重总值,根据体重总值确定所需轿厢数量;
获取训练数据,所述训练数据包括:各个用户的到达时间、离开时间和初始楼层;
通过Q‑Learning算法对所述训练数据进行学习,获得最优策略;
将所述最优策略转换成控制信号控制各个轿厢的运行;
所述通过Q‑Learning算法对所述训练数据进行学习并获得最优策略包括:将多轿厢电梯调度问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数,具体为:状态,用s表示,设G={1,2,3…m}为所有楼层的集合,m为楼层的层数,设V={1,…n}是轿厢的集合,n为轿厢的数量,第i个轿厢在第j个楼层情况数据为vi,j,其中i∈v,j∈G,则状态表示为:s=(v1,1,v2,1,…vn,m);
动作,用a表示,可采取的动作为:不动、上或下,设G1={0,1,2},0表示不动,1表示上,2表示下,设第i个轿厢采取的动作为aij,其中,i∈V,j∈G1,则动作表示为:a=(a10,a11,a12…an0,an1,an2);
立即奖赏函数,具体为:
其中, t1为到达时间,t2为离开时间,折扣参数β>0;
建立值函数回报模型,设R(s,a)表示在状态s下采用动作a的回报值,值函数Q(s,a)是关于R(s,a)的期望,则Q(s,a)=E[R(s,a)];
利用Q‑learning算法获得最优策略包括:
设在t1时刻处于状态s并采取动作a,然后下一个决策要求在t2时刻处在状态s′,应用的更新公式为:s←s′,
a←a′,
其中,α为学习速率。
2.根据权利要求1所述的多轿厢电梯控制方法,其特征在于,所述获取各个用户体重是通过以下方法实现:获取用户图像,通过CNN算法,根据用户图像获得用户画像,用户的体重由以下公式计算获得:g=s*p,其中,g为用户的体重,s为用户画像的面积,p值由已知体重的测试用户计算得到。
3.根据权利要求1所述的多轿厢电梯控制方法,其特征在于,所述获取训练数据是通过以下方法实现:获取用户图像,通过CNN算法,根据用户图像获得用户画像,并将用户画像与已保存的比对用户画像进行匹配,如果匹配成功,则将已保存的比对用户画像删除,并将所述用户图像的获取时间记录为离开时间t2,如果匹配没有成功,则保存所述用户画像,形成已保存的比对用户画像,并将所述用户图像的获取时间记录为到达时间t1,同时将所述用户图像的获取楼层记录为初始楼层。
4.根据权利要求3所述的多轿厢电梯控制方法,其特征在于,根据所述用户画像包括以下信息:用户性别,用户衣服,用户裤子和用户鞋。
5.一种多轿厢电梯控制系统,其特征在于,包括:
体重获取模块,所述体重获取模块用于获取各个用户体重,将各个用户体重相加获得体重总值,根据体重总值确定所需轿厢数量;
训练数据获取模块,所述训练数据获取模块用于获取训练数据,所述训练数据包括:各个用户的到达时间、离开时间和初始楼层;
策略学习模块,所述策略学习模块用于通过Q‑Learning算法对所述训练数据进行学习,获得最优策略;
电梯调度控制器,所述电梯调度控制器用于将所述最优策略转换成控制信号控制各个轿厢的运行;
所述通过Q‑Learning算法对所述训练数据进行学习并获得最优策略包括:将多轿厢电梯调度问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数,具体为:状态,用s表示,设G={1,2,3…m}为所有楼层的集合,m为楼层的层数,设V={1,…n}是轿厢的集合,n为轿厢的数量,第i个轿厢在第j个楼层情况数据为vi,j,其中i∈v,j∈G,则状态表示为:s=(v1,1,v2,1,…vn,m);
动作,用a表示,可采取的动作为:不动、上或下,设G1={0,1,2},0表示不动,1表示上,2表示下,设第i个轿厢采取的动作为aij,其中,i∈V,j∈G1,则动作表示为:a=(a10,a11,a12…an0,an1,an2);
立即奖赏函数,具体为:
其中, t1为到达时间,t2为离开时间,折扣参数β>0;
建立值函数回报模型,设R(s,a)表示在状态s下采用动作a的回报值,值函数Q(s,a)是关于R(s,a)的期望,则Q(s,a)=E[R(s,a)];
利用Q‑learning算法获得最优策略包括:
设在t1时刻处于状态s并采取动作a,然后下一个决策要求在t2时刻处在状态s′,应用的更新公式为:s←s′,
a←a′,
其中,α为学习速率。
6.根据权利要求5所述的多轿厢电梯控制系统,其特征在于,所述体重获取模块包括摄像头以及图像处理模块,所述摄像头用于获取用户图像,所述图像处理模块通过CNN算法,根据用户图像获得用户画像,并由以下公式计算获得用户的体重:g=s*p,其中,g为用户的体重,s为用户画像的面积,p值由已知体重的测试用户计算得到。
7.根据权利要求5所述的多轿厢电梯控制系统,其特征在于,所述训练数据获取模块包括摄像头以及图像处理模块,所述摄像头用于获取用户图像,所述图像处理模块通过CNN算法,根据用户图像获得用户画像,并将用户画像与已保存的比对用户画像进行匹配,如果匹配成功,则将已保存的比对用户画像删除,并将所述用户图像的获取时间记录为离开时间t2,如果匹配没有成功,则保存所述用户画像,形成已保存的比对用户画像,并将所述用户图像的获取时间记录为到达时间t1,同时将所述用户图像的获取楼层记录为初始楼层。
8.根据权利要求7所述的多轿厢电梯控制系统,其特征在于,根据所述用户画像包括以下信息:用户性别,用户衣服,用户裤子和用户鞋。
9.根据权利要求5所述的多轿厢电梯控制系统,其特征在于,所述体重获取模块包括摄像头以及图像处理模块,所述摄像头用于获取用户图像,所述图像处理模块通过CNN算法,根据用户图像获得用户画像,并由以下公式计算获得用户的体重:g=s*p,其中,g为用户的体重,s为用户画像的面积,p值由已知体重的测试用户计算得到;
所述训练数据获取模块包括所述摄像头以及所述图像处理模块,所述图像处理模块将用户画像与已保存的比对用户画像进行匹配,如果匹配成功,则将已保存的比对用户画像删除,并将所述用户图像的获取时间记录为离开时间t2,如果匹配没有成功,则保存所述用户画像,形成已保存的比对用户画像,并将所述用户图像的获取时间记录为到达时间t1,同时将所述用户图像的获取楼层记录为初始楼层。