利索能及
我要发布
收藏
专利号: 2019109574216
申请人: 南京星耀智能科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-15
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于拟态对抗学习机制的现场态势未来引导技术,其特征在于:具体步骤为:

(1)将连续的多帧拟态环境图像作为一个batch保存,后面作为模型的输入数据;(2)构建卷积神经网络,使用2‑6层3*3或5*5卷积核进行特征的提取,在卷积操作之后使用最大池化层,获取拟态环境图像中的关键特征数据,在卷积层后面接上两层全连接层,通过全连接层进行强化学习决策中的函数近似;其中,卷积神经网络包括数据输入模块、特征抽取模块、梯度反转层、领域判别模块、引导识别模块;所述引导识别模块中引入领域判别器;

步骤(1)中,所述模型内输入数据,包括源领域数据、目标领域数据;采用领域迁移的对抗学习的方法进行训练处理,将源领域数据迁移到目标领域数据内;

所述对抗学习的方法:采用快速梯度法,通过模型的目标损失函数,对输入数据求解梯度,并将其加到相应的输入维度中,生成对抗样本;在每次对抗扰动添加时,使用一个任意小的正数eplison控制图像的扰动强度,进行改变原始样本的数据分布;在每一步,通过梯度方向传播算法,获取原始样本数据最差情况的对抗噪声delta,产生需要的对抗样本;

基于领域迁移的对抗学习方法来训练模型,在已训练好的或包含较多标注数据的源领域进行预训练,对抗迁移至只有少量标注数据的目标领域进行微调和测试;

领域对抗网络中,通过抽取在目标领域和源领域可迁移的特征表示,降低不同领域数据的分布差异;

所述引导识别模型中引入领域判别器,并在特征抽取模块和领域判别器之间添加梯度反转层,梯度反转层在模型的前向计算过程中相当于恒等变化,而在模型的误差反向传播过程中,改变了由领域判别器回传的梯度,整个对抗学习策略相当于一个双人博弈游戏,其中一个玩家是领域判别器,区分数据来源,另一个玩家是特征抽取器,用来迷惑领域判别器,使其无法正确地区分数据来源。

2.根据权利要求1所述的基于拟态对抗学习机制的现场态势未来引导技术,其特征在于:步骤(1)中所述batch的大小作为超参数,有人工指定,设置为3‑6个。

3.根据权利要求1所述的基于拟态对抗学习机制的现场态势未来引导技术,其特征在于:领域迁移时,先对已经训练好的或包含较多标注数据的源领域数据进行预训练,再进行对抗迁移至只有少量标注数据的目标领域进行微调、测试。