1.一种面向类脑机制的无人驾驶紧急避障方法,其特征在于,包括:基于车道场景,获取状态脉冲序列;
将所述状态脉冲序列输入至训练好的优化脉冲神经网络,获取无人驾驶紧急避障策略;
其中,训练好的优化脉冲神经网络的获取方法包括:
基于基底神经节,利用伊兹克维奇神经元模型构建脉冲神经网络;
基于眶额皮层信号响应机制和前扣带皮层警惕反应机制,对所述脉冲神经网络进行优化,获取优化脉冲神经网络;
基于深度Q网络,对所述优化脉冲神经网络进行训练,获取训练好的优化脉冲神经网络。
2.根据权利要求1所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,基于车道场景,获取状态脉冲序列,包括:基于车道场景,采集事件驱动数据;
对所述事件驱动数据进行预处理,获取二值化图像;
基于所述二值化图像,获取状态脉冲序列。
3.根据权利要求2所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,所述事件驱动数据通过动态视觉传感器对所述车道场景进行采集获取。
4.根据权利要求1所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,基于基底神经节,利用伊兹克维奇神经元模型构建脉冲神经网络,包括:基于基底神经节中背侧纹状体结构,利用伊兹克维奇神经元模型构建表演家网络,所述表演家网络用于:基于赫布记忆缓冲区,根据所述状态脉冲序列,选择避障动作,获取避障动作奖励,并根据所述避障动作,输出无人驾驶紧急避障策略;
基于基底神经节中腹侧纹状体结构,利用伊兹克维奇神经元模型构建评判家网络,所述评判家网络用于:根据所述避障动作,输出避障动作价值函数,并根据所述避障动作价值函数,输出时序差分误差;
由所述表演家网络和评判家网络构成脉冲神经网络;
其中,所述表演家网络根据所述避障动作价值函数对避障动作选择进行优化。
5.根据权利要求4所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,基于眶额皮层信号响应机制和前扣带皮层警惕反应机制,对所述脉冲神经网络进行优化,获取优化脉冲神经网络,包括:基于眶额皮层信号响应机制,构建奖励信号预处理模块,所述奖励信号预处理模块用于:基于所述避障动作奖励,根据所述时序差分误差,输出奖励信号,并根据所述奖励信号,输出警惕值;
基于前扣带皮层警惕反应机制,构建探索模块,所述探索模块用于:根据所述警惕值,输出探索值;
由所述表演家网络、评判家网络、奖励信号预处理模块、探索模块构成优化脉冲神经网络;
其中,所述表演家网络根据所述探索值探索新的无人驾驶紧急避障策略。
6.根据权利要求1所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,基于深度Q网络,对所述优化脉冲神经网络进行训练,获取训练好的优化脉冲神经网络,包括:基于预构建的模拟车道场景,获取模拟状态脉冲序列;
将所述模拟状态脉冲序列输入至深度Q网络进行训练,基于ε‑贪婪策略选择模拟避障动作,获取模拟避障动作价值函数,并将模拟状态、模拟避障动作、模拟避障动作奖励、下一模拟状态、车辆与障碍物的模拟距离存储至经验缓冲区;
对所述经验缓冲区进行重放,获取重放经验缓冲区;
基于所述重放经验缓冲区,利用多头注意力机制进行情景检索,获取情景回忆状态和情景回忆动作并存储至工作记忆缓冲区;
基于赫布学习规则,对所述工作记忆缓冲区进行更新,并将更新后的工作记忆缓冲区中前k%的情景回忆状态和情景回忆动作转移至赫布记忆缓冲区;
直至所述深度Q网络达到预设训练终止条件为止,将所述模拟避障动作价值函数输入至分类网络,获取分类权重;
对所述分类权重进行归一化处理,获取归一化权重;
将所述归一化权重作为所述优化脉冲神经网络的初始化权重,基于所述赫布记忆缓冲区,对所述优化脉冲神经网络进行训练,获取训练好的优化脉冲神经网络。
7.根据权利要求6所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,基于预构建的模拟车道场景,获取模拟状态脉冲序列,包括:基于预购建的模拟车道场景,采集模拟事件驱动数据;
对所述模拟事件驱动数据进行预处理,获取二值化模拟图像;
基于所述二值化模拟图像,获取模拟状态脉冲序列。
8.根据权利要求6所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,将所述归一化权重作为所述优化脉冲神经网络的初始化权重,基于所述赫布记忆缓冲区,对所述优化脉冲神经网络进行训练,获取训练好的优化脉冲神经网络,包括:将所述归一化权重作为所述优化脉冲神经网络的初始化权重,基于所述赫布记忆缓冲区,利用时序差分误差调制脉冲时序依赖可塑性算法,对所述优化脉冲神经网络的表演家网络进行训练,利用奖励调制脉冲时序依赖可塑性算法,对所述优化脉冲神经网络的评判家网络进行训练,获取训练好的优化脉冲神经网络。
9.根据权利要求8所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,在利用时序差分误差调制脉冲时序依赖可塑性算法,对所述优化脉冲神经网络的表演家网络进行训练,利用奖励调制脉冲时序依赖可塑性算法,对所述优化脉冲神经网络的评判家网络进行训练时,基于兴奋性丘脑皮质中继细胞‑抑制性丘脑网状核细胞信号调节机制,利用信用分配增益对所述时序差分误差调制脉冲时序依赖可塑性算法和奖励调制脉冲时序依赖可塑性算法进行信用分配。
10.根据权利要求2或7所述的面向类脑机制的无人驾驶紧急避障方法,其特征在于,所述预处理包括图像缩小、图像裁剪、图像帧累积处理和图像二值化处理。