1.一种注塑机自适应学习快速控制方法,其特征在于,包括以下步骤:S1:构建注塑机射胶控制模型;
S2:根据所述注塑机射胶控制模型构建MPC模型;
S3:给定不同跟踪目标,利用所述MPC模型进行反复优化,得到训练数据集;
S4:构建GRU神经网络并引入注意力机制,利用所述训练数据集对GRU神经网络进行训练,得到训练好的GRU神经网络;
S5:通过训练好的GRU神经网络实现对注塑机的自适应学习快速控制;
所述注塑机射胶控制模型为:
其中,G(s)为注塑机射胶控制模型,s为复数域下的复变量,q1、p1、p2、p3、p4分别为不同的注塑机射胶控制模型参数;
在步骤S2中,具体包括以下步骤:S2.1:对所述注塑机射胶控制模型进行离散化得到Z域模型;
S2.2:根据所述Z域模型得到以下离散状态方程的可观标准型:x(k+1)=Ax(k)+Bu(k)+Dξ(k) (1)y(k)=Cx(k)+ξ(k) (2)其中,系数矩阵 系数矩阵 系数矩阵C=[1 0
0 0],系数矩阵 x为离散状态方程的状态变量,k表示运行的时间步,ξ为外部干扰或扰动,u为注塑机注射过程中电控阀门的开度,y为注塑机射胶速度;
S2.3:取ξ(k)=y(k)‑Cx(k),其系数矩阵为K,则由离散状态方程(1)、(2)得到以下MPC模型:
x(k+1)=Ax(k)+Bu(k)+K(y(k)‑Cx(k)) (3)y(k)=Cx(k) (4)当系统稳定时,K=D;
所述GRU神经网络为seq2seq模型结构;
所述Seq2seq模型包括编码器和解码器,且以门控循环单元作为单个神经元,所述门控循环单元包括重置门和更新门;
其中,编码器中的门控循环单元包含15层隐藏层,解码器中的门控循环单元包含1层隐藏层,且解码器中的门控循环单元均输出到同1层神经网络。
2.根据权利要求1所述的一种注塑机自适应学习快速控制方法,其特征在于,在步骤S2中,还包括以下步骤:
选择增量△u作为优化目标,△u(k)=u(k)‑u(k‑1),令MPC模型的代价函数J为:其中,p为总时间步数,Qj、Rj分别为y和Δu的权重矩阵,yref为目标输出,t为当前运行的时间步,j为预测的时间步,T为转置符号。
3.根据权利要求2所述的一种注塑机自适应学习快速控制方法,其特征在于,通过以下步骤利用MPC模型进行优化求解:根据公式(3)、(4)得到以下离散状态方程,X=A′x(k)+B′I′△U+B′I″u(k‑1)+K′ξ(k) (6)Y=C′X (7)其中
联立公式(5)、(6)、(7)得到以下二次规划标准型,s.t.a△U≤b (9)其中,
T T T
H=I′B′C′QC′B′I′+R,T T T T T T T T T T TP=4[x(k) A′C′QC′B′I′+u(k‑1) I″B′C′QC′B′I′+ξ(k) K′C′QC′B′I′‑YrefQC′B′I′],
T T T T T
△U表示△U的转置,I′表示I′的转置,B′表示B′的转置,C′表示C′的转置,P表示P的转置;
基于二次规划标准型(8)、(9)进行二次规划求解计算出最优控制增量△u。
4.根据权利要求3所述的一种注塑机自适应学习快速控制方法,其特征在于,通过以下步骤对二次规划标准型进行二次规划求解:引入松弛变量将不等式约束转化为等式约束:将公式(8)、(9)写成以下一般形式,min f(x) (10)s.t.g(x)≤0 (11)其中,x=△U, g(x)=ax‑b,g(x)为约束项;
上述问题满足KKT条件,不等式约束转为等式约束,存在最优解,KKT条件为
其中,μ为KKT乘子,联立(10)、(11)、(12),得到以下拉格朗日函数:L(x,μ)=f(x)+μg(x) (13)通过拉格朗日法令其偏导为零:从而计算得到当前情况下的最优解。
5.根据权利要求1所述的一种注塑机自适应学习快速控制方法,其特征在于,所述训练数据集包括若干个时间步的被控对象的目标输出、被控对象输出量、过程状态量以及控制量。
6.根据权利要求1所述的一种注塑机自适应学习快速控制方法,其特征在于,在编码器与解码器之间引入所述注意力机制。
7.根据权利要求6所述的一种注塑机自适应学习快速控制方法,其特征在于,所述注意力机制为:
其中,Q、K、V分别为注意力机制的输入,dk为K的维度, zu表示第i个输入,函数的输出为C个类别,范围为[0,1]的概率分布。