1.一种车辆自动驾驶决策方法,其特征在于,包括:
获取目标车辆的当前位置信息、当前导航信息、当前行驶工况信息和所述目标车辆所行驶的道路的当前道路环境信息;
基于所述目标车辆的当前位置信息与所述当前道路环境信息,确定所述目标车辆的行驶场景,所述行驶场景包括道路行驶场景和路口行驶场景;
在所述目标车辆的行驶场景为所述道路行驶场景时,根据道路横向决策策略对所述目标车辆的当前行驶工况信息和所述当前道路环境信息进行处理,得到所述目标车辆的第一横向决策结果;所述道路横向决策策略为预先训练好的道路横向决策模型,所述预先训练好的道路横向决策模型,基于状态空间、动作空间、状态概率转移函数和奖励函数建立;
在所述目标车辆的行驶场景为所述路口行驶场景时,根据路口横向决策策略对所述目标车辆的当前导航信息和所述当前道路环境信息进行处理,得到所述目标车辆的第二横向决策结果;所述路口横向决策模型为基于有限状态机的横向决策策略,所述基于有限状态机的横向决策策略,通过建立预设导航信息、预设道路环境信息和预设初始横向决策结果,与预设目标横向决策结果之间的映射关系得到;
根据所述第一横向决策结果和/或所述第二横向决策结果确定所述目标车辆的行驶轨迹。
2.根据权利要求1所述的车辆自动驾驶决策方法,其特征在于,所述基于所述目标车辆的当前位置信息与所述当前道路环境信息,确定所述目标车辆的行驶场景,包括:所述当前道路环境信息包括所述目标车辆的前方目标路口和后方目标路口信息;
在所述目标车辆的当前位置信息与所述前方目标路口之间的距离大于等于第一距离阈值或所述目标车辆的当前位置信息与所述后方目标路口之间的距离大于等于第二距离阈值的情况下,确定所述目标车辆的行驶场景为所述道路行驶场景。
3.根据权利要求1‑2任一项所述的车辆自动驾驶决策方法,其特征在于,所述基于所述目标车辆的当前位置信息与当前道路环境信息,确定所述目标车辆的行驶场景,包括:所述当前道路环境信息包括目标车辆的前方目标路口和后方目标路口信息;
在所述目标车辆的当前位置信息与所述前方目标路口之间的距离小于第一距离阈值或所述目标位置信息与所述后方目标路口之间的距离小于第二距离阈值的情况下,确定所述目标车辆的行驶场景为所述路口行驶场景。
4.根据权利要求3所述的车辆自动驾驶决策方法,其特征在于,所述根据道路横向决策策略对所述目标车辆的当前行驶工况信息和所述当前道路环境信息进行处理,得到所述目标车辆的第一横向决策结果,包括:接收服务器发送的道路横向决策模型;
将接收到的所述道路横向决策模型作为所述道路横向决策策略;
根据所述道路横向决策模型对所述目标车辆的当前行驶工况信息和所述当前道路环境信息进行处理,得到所述目标车辆的所述第一横向决策结果;
其中,所述道路横向决策模型为基于样本车辆的样本数据,对预设模型进行训练得到,所述预设模型为基于马尔可夫强化学习的模型,所述样本数据包括所述样本车辆的样本行驶工况信息和所述样本车辆所行驶的道路的样本道路环境信息。
5.根据权利要求4所述的车辆自动驾驶决策方法,其特征在于,所述方法还包括:接收所述服务器发送的更新后的道路横向决策模型;
将所述更新后的道路横向决策模型作为所述道路横向决策策略;
其中,所述更新后的道路横向决策模型为基于更新后的样本数据,对所述预设模型进行训练得到;所述更新后的样本数据为基于所述目标车辆的当前行驶工况信息和所述当前道路环境信息,对所述样本数据进行更新得到。
6.根据权利要求1所述的车辆自动驾驶决策方法,其特征在于,所述方法还包括:获取所述预设车辆的预设导航信息、所述预设车辆所行驶的道路的预设道路环境信息、所述预设初始横向决策结果和所述预设目标横向决策结果;
建立所述预设导航信息、所述预设道路环境信息和所述预设初始横向决策结果,与所述预设目标横向决策结果之间的映射关系;
将所述映射关系作为所述路口横向决策策略。
7.根据权利要求6所述的车辆自动驾驶决策方法,其特征在于,所述根据所述路口横向决策策略对所述目标车辆的当前导航信息和所述当前道路环境信息进行处理,得到所述目标车辆的第二横向决策结果,包括:获取所述目标车辆的当前初始横向决策结果;
根据所述映射关系,获取与所述当前导航信息、所述当前道路环境信息和所述当前初始横向决策结果对应的预设横向决策结果;
将与所述当前导航信息、所述当前道路环境信息和所述当前初始横向决策结果对应的所述预设横向决策结果,作为所述第二横向决策结果。
8.根据权利要求1所述的车辆自动驾驶决策方法,其特征在于,所述根据所述第一横向决策结果和/或所述第二横向决策结果,确定所述目标车辆的行驶轨迹,包括:将所述第一横向决策结果和/或所述第二横向决策结果作为所述目标车辆的目标横向决策结果;
基于所述目标横向决策结果,确定目标纵向决策结果;
根据所述目标横向决策结果和所述目标纵向决策结果,确定所述目标车辆的行驶轨迹。
9.一种车辆自动驾驶决策装置,其特征在于,包括:
获取模块,用于获取目标车辆的当前位置信息、当前导航信息、当前行驶工况信息和所述目标车辆所行驶的道路的当前道路环境信息;
场景确定模块,用于基于所述目标车辆的当前位置信息与所述当前道路环境信息,确定所述目标车辆的行驶场景,所述行驶场景包括道路行驶场景和路口行驶场景;
第一横向决策模块,用于在所述目标车辆的行驶场景为所述道路行驶场景时,根据道路横向决策策略对所述目标车辆的当前行驶工况信息和所述当前道路环境信息进行处理,得到所述目标车辆的第一横向决策结果;所述道路横向决策策略为预先训练好的道路横向决策模型,所述预先训练好的道路横向决策模型,基于状态空间、动作空间、状态概率转移函数和奖励函数建立;
第二横向决策模块,用于在所述目标车辆的行驶场景为所述路口行驶场景时,根据路口横向决策策略对所述目标车辆的当前导航信息和所述当前道路环境信息进行处理,得到所述目标车辆的第二横向决策结果;所述路口横向决策模型为基于有限状态机的横向决策策略,所述基于有限状态机的横向决策策略,通过建立预设导航信息、预设道路环境信息和预设初始横向决策结果,与预设目标横向决策结果之间的映射关系得到;
轨迹确定模块,用于根据所述第一横向决策结果和/或所述第二横向决策结果,确定所述目标车辆的行驶轨迹。
10.一种车载终端,其特征在于,所述车载终端包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者所述至少一段程序由所述处理器加载并执行以实现如权利要求1至8任一所述的车辆自动驾驶决策方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或者至少一段程序,所述至少一条指令或者所述至少一段程序由处理器加载并执行以实现如权利要求1至8任一所述的车辆自动驾驶决策方法。