1.一种基于DQN的压铸工艺自动优化方法,其特征在于,包括如下步骤:(1)对压铸机冷却系统中的水阀进行标号,分别为水阀1号—水阀N号;水阀的开启和关闭状态用一个长度为2N的向量表示;其中,取值大的为下一时刻阀门的状态;
(2)获取压铸机工作过程中冷却系统的热像图;
(3)以步骤(2)中的热像图为输入、以长度为2N的向量作为输出建立DQN模型;
(4)通过若干次试生产所产生的大数据对步骤(3)所建立的DQN模型进行训练;
(5)将步骤(4)中训练好的模型用于压铸工作中,对冷却系统的阀门开关进行逻辑控制实现产品生产工艺的自动优化;
所述步骤(4)具体包含如下步骤:
(41)进入试生产阶段,设定第i个产品的生产,进行第m次拍照,并对产生的热像图进行预处理,形成 是300*300的二维向量;
(42)随机产生一个长度为2N的向量Sm作为控制N个阀门的初始状态;
(43)对于第i个产品的第m次热图照片,生成标签 其
i‑1 i
中,λ为衰减参数,取 Q (m,n)是更新之前的Q矩阵中第m行第n列的元素值,r 是i第i个产品生产完成后的质量评价结果, 其中δ是第i个有无内部缺陷的i i标志,第i个产品内部有缺陷时δ=0,否则δ=1;J是标准产品中标准尺寸的总个数; 为标准产品中的第j个尺寸,表示产品i中的第j个尺寸;
(44)对于第i个产品分别以 为输入,以 为标签,更新netm;对于第i个产品分别用netm更新矩阵的第m行, 最终得到
I
(45)试生产结束后,不再更新Q和netm,得到Q,
所述步骤(1)中取值大的为下一时刻阀门的状态,具体是Sm为长度为2N的向量,其中,Sm的第2n‑1位、第2n位控制第n个阀门,n=1,2,…N,第n个阀门的第2n‑1位的数字表示阀门n开启状态,第2n位的数字表示阀门n关闭状态;比较第2n‑1位的数字和第2n位的数字大小,若第2n‑1位的数字大,则阀门n当前的状态为开启状态,若第2n位的数字大,则阀门n的当前状态为关闭状态。
2.根据权利要求1所述的基于DQN的压铸工艺自动优化方法,其特征在于,步骤(3)中的具体过程如下:初始化结构体D;随机产生矩阵QM×2N;其中M指的是单个压铸产品生产过程中拍摄的热图的次数,N为冷却系统中的水阀个数;初始化M个深度学习网络netm。
3.根据权利要求1所述的基于DQN的压铸工艺自动优化方法,其特征在于,步骤(3)中的深度学习网络采用由4层卷积层+2层全连接层构成的卷积神经网络:Layer1中的卷积层中共有5个大小均为37的卷积核,输入为长为300*300的二维向量,最大池化层中核的大小和步长均为2;Layer2中的卷积层中共有5个大小均为31的卷积核,最大池化层中核的大小和步长均为2;Layer3中的卷积层中共有5个大小均为29的卷积核,最大池化层中核的大小和步长均为2;Layer4中的卷积层中共有5个大小均为29的卷积核,最大池化层中核的大小和步长均为2;layer5‑layer6为全连接层,layer5的输出层的神经元个数为45;激励函数为线性激活函数;layer6的输出神经元个数为2N个,激活函数为sigmoid激活函数。
4.根据权利要求3所述的基于DQN的压铸工艺自动优化方法,其特征在于,训练算法可以为:随机梯度下降算法、Adam算法、RMSProp算法、Adagrad算法、Adadelta算法、Adamax算法中任意一个。