1.一种高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,包括以下步骤:设定针对于高速公路瓶颈区域的控制区域,对于控制区域内的车辆,构建考虑车辆通行时间、耗电量的车辆轨迹优化模型;所述模型用于根据车辆的实时速度、加速度来计算成本值;
将车辆的通行优先权顺序寻优转换为树搜索以进行树结构的展开,将蒙特卡洛树搜索算法与设定的选择策略相结合,使得搜索不断向总成本更小的方向进行搜索,得到候选的通行优先权顺序;
根据所述候选通行优先权顺序对车辆轨迹进行轨迹规划,使得车辆能从初始化状态行驶到候选的通行优先权顺序所对应的状态,并根据车辆轨迹优化模型计算出该过程的总成本;
通过不断循环迭代,直到所述树结构扩展的节点中包含所有车辆为止,得到对应总成本最小的通行优先权顺序和对应的车辆轨迹,然后利用该车辆轨迹对控制范围内的车辆进行控制,达到最小化通行时间和耗电量的目的。
2.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,所述车辆轨迹优化模型表示如下:
其中,x(t),u(t)分别为控制区域内车辆在t时刻的状态集合和输入向量集合,N为控制区域内的车辆数,ω1、ω2分别为时间成本系数和耗电成本系数,用于将成本转换为价格;
和 分别表示车辆i通过瓶颈区域的时间和进入瓶颈区域的时间, 表示车辆i的净耗电量,由车辆的运动学数据、车辆的系统间转换效率计算得到;
所述车辆轨迹优化模型的约束包括车辆动力学约束、车辆的通行优先权以及车辆碰撞避免约束。
3.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,所述将车辆的通行优先权顺序寻优转换为树搜索以进行树结构的展开,将蒙特卡洛树搜索算法与设定的选择策略相结合,包括:
3.1对控制区域内的车辆进行ID分配;
3.2将每个车辆作为一个节点,节点的数据信息包含车辆编号ID组成的字符串S、父节点和子节点信息,并且包含其被遍历次数N、奖励值Q;
3.3传入当前需要开始搜索的起始节点P,根据设定的选择策略返回最好的节点进行扩展,如果节点是叶节点,此时全部车辆编号ID均在字符串S中,则直接结束;
3.4对于所返回的节点,该节点上拓展一个新节点作为其子节点,其中新节点的字符串S形成是在其父节点的字符串的末尾添加新的车辆编号ID;在此过程中,对于同一父节点的子节点,它们之间的字符串S不能重复;
3.5对于所述新节点进行奖励值评估,在此过程中进行节点的通行优先权顺序规划,并计算该新节点的奖励值;
3.6根据所述新节点的奖励值,向上回溯,对该新节点及其上游父节点的数据信息进行更新;
3.7重复步骤3.3‑3.7,直到循环起始节点中的字符串S包含了所有的车辆编号ID,则该字符串S为最优的候选通行优先权顺序。
4.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,所述对于所述新节点进行奖励值评估,在此过程中进行节点的通行优先权顺序规划,并计算该新节点的奖励值,包括:
3.5.1根据给出的新节点,获取该节点的字符串S,若S包含所有的车辆编号ID,则直接跳过步骤3.5.2,否则需要将未添加的车辆编号ID追加到S中,进而得到完整的通行优先权顺序Ψ,具体步骤如下:
(1)首先将车辆编号按照车道分成三个数组P1、P2、P3,数组内元素按照距离冲突区域纵向距离排序;
(2)将P1、P2、P3中已经出现在字符串S中的元素移除,若出现空数组则也将其移除;在所存数组中随机选择一个数组Pi,并取出其第一个元素Pi(1),将该元素添加到S的末尾;
(3)重复步骤(1)和(2),直到S中包含所有车辆ID;最后得到完整通行优先权顺序Ψ;
3.5.2将步骤3.5.1给出的完整的通行优先权顺序Ψ进行车辆轨迹规划,最后得到新节点的奖励值。
5.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,所述设定的选择策略为:
先找当前未遍历过的子节点,如果有多个则随机选;如果都遍历过就找UCB值最大的,如果UCB值相等则随机选;节点v′的UCB值计算如下:其中,v′表示当前节点,v表示v′的父节点,Q表示该节点的累计的奖励值,N表示节点的访问次数,c为权重参数。
进一步地,根据所述候选通行优先权顺序对车辆轨迹进行轨迹规划,使得车辆能从初始化状态行驶到候选的通行优先权顺序所对应的状态,并根据车辆轨迹优化模型计算出该过程的总成本,包括:
4.1将所有车辆ID构建矩阵,将其与候选通行优先权顺序矩阵进行差分运算,并对该结果进行处理,使得差分值对应的车辆ID与其索引值一致,最后得到差分矩阵,进而确定车辆的目标速度;
4.2根据所确定的目标速度,进行单辆车辆的轨迹规划;
4.3局部轨迹规划:将控制区域内所有的车辆都执行步骤4.2,即可得到所有车辆的局部轨迹优化;
4.4全局轨迹规划:根据步骤4.3所得到的所有车辆的局部轨迹,为得到全局轨迹,需要不断地进行采样更新车辆位置信息,然后根据车辆更新的位置信息重新进行执行步骤4.3中的局部轨迹规划;
4.5循环执行步骤4.4直到所有车辆均通过瓶颈区域为止;最后得到车辆整个过程的轨迹规划方案、总通行时间和总耗电量,然后计算出该过程的总成本值;
4.6根据步骤4.5所得到的总成本值,将其反馈回到步骤3.5.2中作为其奖励值q。
6.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,根据所确定的目标速度,进行单辆车辆的轨迹规划,包括:
4.2.1在Frenet坐标中根据沿着给定参考线的纵向位移s和距离该参考线的横向偏移d来指定车辆位置(s,d),同时轨迹点可以用 来表示,其中 分别为s的一阶导和二阶导, 分别为d的一阶导和二阶导;
4.2.2,定义车辆轨迹集合 集合中的轨迹都是由s(t)和d(t)构成,表示为沿着Frenet轴的时间多项式:
i
其中,s(t)和d(t)表示t时刻的纵向位移s、横向偏移d,ai、ci为多项式系数,t为时间参数,t0为轨迹起始时间,tf为轨迹终点时间;故若要求出完整的轨迹集合则只需要求解出ai、ci这些多项式系数即可;
4.2.3,在得到Frenet坐标下的轨迹集合 后,经过数值变换将其转换为笛卡尔坐标[x,y,θ,k,v,a],其中[x,y]为在笛卡尔坐标系下位置,k为曲率,θ为航向角,v为速度,a为加速度;
4.2.4,根据车辆的动力学约束和车辆碰撞避免约束,可以将其细化为硬约束和软约束,用以排除不符合约束条件的轨迹以及挑选出最优轨迹
7.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,求解多项式系数ai、ci以得到完整的轨迹集合的过程为:(1)为了保持前一轨迹的连续性和动态可行性,需要对轨迹终端的做出以下约束:其中,tf为轨迹终点时间;df为最终横向位置,忽略了终端状态的横向速度,所以d在终点时间的导数及二阶导均设为0;vf为最终纵向速度;
(2)可以通过 确定的轨迹初始状态 和轨迹末端状态并在时间间隔T内,利用五次和四次多项式来进行拟合求解出ai、ci,进而完成这两个状态之间的轨迹规划;
(3)为得到df、vf的取值,分别设置三种不同的终止状态,即巡航、变道和跟车模式,具体设置如下:
a)巡航模式下,设置df保持与初始状态的d0一样,vf设置为目标速度;
b)变道模式下,设置df为邻近车道中心,vf设置为目标速度;
c)跟车模式下,设置df保持与初始状态的d0一样,vf设置为前车速度。
(4)通过以上步骤可以得到一个轨迹集合
8.根据权利要求1所述的高速公路瓶颈区域自动驾驶协同优化方法,其特征在于,所述根据车辆的动力学约束和车辆碰撞避免约束,可以将其细化为硬约束和软约束,用以排除不符合约束条件的轨迹以及挑选出最优轨迹 包括:a)碰撞避免约束,若轨迹集合 中存在与其他车辆发生碰撞的轨迹 则直接排除该碰撞轨迹
b)硬约束,用以排除不符合车辆动力性能标准的轨迹:上式中,k(t)、θ(t)、a(t)表示t时刻的曲率k、航向角θ、加速度a;kmax、θmax、vmax、amax表示设定的曲率、航向角、速度、加速度的最大值,vmin表示设定的速度最小值;
c)软约束,通过设计一个成本函数,然后利用数值优化在轨迹集 中找出成本最小的轨迹;
其中,表示轨迹集,ωd、ωv、ωa为权重系数,ddes表示目标车道中心,vdes(t)表示标速度,a(t)表示车辆加速度,d(t)和v(t)表示t时刻的横向偏移和速度;
d)通过步骤a)、b)、c)的筛选,可以在轨迹集合 中挑选最优的轨迹