利索能及
我要发布
收藏
专利号: 2024119655511
申请人: 乐山京隆石英玻璃制品有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-22
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于机器学习的石英坩埚高温抗变形率预测方法,其特征在于,包括以下步骤:步骤1:收集与石英坩埚抗变形率相关的历史数据,包括铝合金成分数据、坩埚物理属性数据、坩埚使用条件以及抗变形率数据,所述抗变形率数据作为对应预测模型训练时输入数据的真实值标签;

步骤2:对采集的历史数据进行预处理,包括缺失值处理、异常值检测与处理、数据归一化以及类别数据编码,得到预处理后的数据;

步骤3:基于预处理后的数据逐步进行皮尔逊相关系数、LASSO回归以及主成分析法,选择重要特征;

步骤4:基于预处理后的数据构建熔炼条件与物理属性之间的交互特征,得到构建的新特征;

所述熔炼条件与物理属性之间的交互特征包括铝含量与坩埚膨胀系数的交互作用特征和熔炼时间与温度的负荷特征;其中铝含量与坩埚膨胀系数的交互作用特征的构建如下: ;

式中: 为可调节参数,反应膨胀系数对交互作用的影响程度; 表示对铝含量进行对数变换; 表示坩埚的膨胀系数; 表示铝合金中的铝含量; 表示铝含量与坩埚膨胀系数的交互作用特征,为一个连续型数值;

所述熔炼时间与温度的负荷特征的构建如下:

式中: 表示熔炼时间; 表示熔炼温度; 表示可调的超参数,控制熔炼时间对负荷效应的衰减速率; 表示自然对数的底数; 表示熔炼时间与温度的负荷特征,为一个连续型数值;

步骤5:基于构建的新特征以及选择的重要特征训练基于深度学习模型构建的预测模型,得到训练好的预测模型;

步骤6:基于训练好的预测模型以及实时数据对石英坩埚高温抗变形率进行预测,得到预测结果;

所述皮尔逊相关系数的对预处理后的数据进行处理的步骤如下:计算每一个特征与对应的抗变形率之间的皮尔逊相关系数:;式中: 表示特征 与抗变形率 之间的相关系数;

和 表示第i个样本的特征值和目标变量值; 和 表示特征 和抗变形率 的均值;n表示样本的数量;若某个特征与目标变量的相关系数 的绝对值低于设定的第一阈值,则剔除该特征,得到第一数据集;

基于第一数据集,对每个特征之间计算皮尔逊相关系数:;

式中: 表示特征 和特征 之间的相关系数, 和 分别表示第i个样本的特征 和特征 的值; 和 分别表示特征 和特征 的均值;

若任意一个特征对之间的皮尔逊相关系数 的绝对值高于预设的第二阈值,则剔除特征对中的任意一个特征,得到第二数据集;

基于所述LASSO回归进行特征筛选的步骤如下:交叉验证:将基于皮尔逊相关系数筛选得到的数据集分为若干个子集,每次选择一个子集作为验证集,其他子集作为训练集,计算每个正则化参数 下的均方误差,采用均方误差最小的正则化参数 ;

模型训练:基于皮尔逊相关系数筛选得到的数据集以及选择的正则化参数 训练LASSO回归模型,采用特征集中的特征 和抗变形率 ,通过最小化LASSO回归模型的损失函数来训练模型,采用梯度下降法来求解最优化问题:;

式中: 表示第i个样本的抗变形率; 表示第i个样本的第j个特征值; 表示第j个特征的回归系数; 表示正则化参数; 表示训练得到的回归系数向量,包含所有特征的权重,表示每个特征对抗变形率的贡献,其中 为特征的总数;

表示回归模型的截距项; 表示第 个特征的回归系数,其中 ;

特征筛选:若 ,则去除对应的特征; 则保留对应的特征;基于特征筛选得到第三数据集。

2.根据权利要求1所述的基于机器学习的石英坩埚高温抗变形率预测方法,其特征在于,所述主成分分析的具体步骤如下:计算协方差矩阵:设基于LASSO回归进行特征筛选后得到的数据集中的数据矩阵为 ,大小为 ,其中 为样本数量, 为特征数量,基于数据矩阵计算协方差: ;

式中: 为 的协方差矩阵,每个元素 表示第i个特征与第j个特征之间的协方差; 表示数据矩阵 的转置;

计算特征值和特征向量:计算协方差矩阵 的特征值和特征向量: ;式中: 表示协方差矩阵的第i个特征值,表示特征方向上的方差; 表示协方差矩阵的第i个特征向量,表示特征方向;

构建降维空间:对特征值  按大小排序,选择前k个特征值对应的特征向量,基于前k个特征值对应的特征向量组成矩阵 ,大小为 ,其中 表示基于LASSO回归进行特征筛选后得到的数据集中的特征数,k表示选择的主成分数量;

将数据映射到降维空间:采用矩阵乘法计算每个数据样本在降维空间中的坐标:;

式中: 表示降维后的得分矩阵,大小为 ,每一行表示一个样本在降维空间中的坐标;

主成分选择:计算每个主成分对应的特征值和总的特征值之和的比例,得到每个主成分对数据方差的贡献比例: ;

式中: 表示第i个主成分的贡献度;

计算累计贡献度:计算前k个主成分的累计贡献度; ;

式中: 表示前k个主成分的累计贡献度;

将计算出的累计贡献度与贡献度阈值进行比较,若累计贡献度高于阈值,则以当前选定的前k个主成分构建第四数据集;若累计贡献度低于阈值,则增大k值,直至累计贡献度高于阈值为止,得到选定的主成分,基于选定的组成分构建第四数据集。

3.根据权利要求1所述的基于机器学习的石英坩埚高温抗变形率预测方法,其特征在于,所述预测模型包括输入层、特征选择层、深度神经网络层、正则化和优化层以及输出层;

所述输入层用于输入构建的新特征以及选择的重要特征,其中输入为构建的新特征以及选择的重要特征拼接成的一个完整的特征向量;

所述特征选择层:所述输入的特征向量经过一个自注意力机制,计算每个特征之间的相关性来为每个特征分配权重,基于分配的权重对特征进行加权,得到加权后的特征,并且在所述自注意力机制后加入Dropout层,其中Dropout层以预定的概率丢弃部分特征,得到保留后的加权特征,将保留后的加权特征传递到深度神经网络层;

所述深度神经网络层包括多个隐藏层,每个隐藏层的输出通过ReLU激活函数进行非线性变换,并且在每个隐藏层后加入Batch Normalization 层进行归一化,在所述Batch Normalization 层后加入Dropout层以预定的概率丢弃部分特征,得到保留后的深度特征;

所述正则化和优化层用于对深度神经网络层的权重施加L2正则化约束,防止模型过拟合;

输出层:基于深度神经网络层的输出采用线性激活输出抗变形率的预测值。

4.根据权利要求3所述的基于机器学习的石英坩埚高温抗变形率预测方法,其特征在于,所述预测模型的损失函数如下:;

式中: 表示均方误差损失; 表示深度神经网络层的正则化超参数;

表示自注意力机制中的权重矩阵; 表示自注意力机制中的正则化超参数;

表示深度神经网络层中的Dropout层的丢弃率; 表示特征选择层中Dropout层的丢弃率; 表示网络中第j个参数;M表示总的参数数量; 表示总的损失函数。