1.一种固态硬盘状态预测模型构建方法,其特征在于,所述方法包括如下步骤:
S100,获取初始特征数据集;其中,每个初始特征数据集包括对应的固态硬盘在设定时间段内的状态标签和特征数据,所述特征数据包括时间序列数据、图像数据和基本信息;所述时间序列数据为SMART日志数据中的关键参数的数值形成的时间序列,所述图像数据为基于时间序列数据得到的图像数据,所述基本信息用于表征固态硬盘的物理特性,所述状态标签包括表征固态硬盘处于正常状态的第一标签和表征固态硬盘处于故障状态的第二标签;
S200,将初始特征数据集中状态标签为第一标签的特征数据作为待处理的数据,并基于所述待处理的数据生成对应的对抗样本数据;
S300,将生成的对抗样本数据加入到所述初始特征数据集中,作为样本数据集,并将样本数据集划分为训练集和测试集;
S300,以样本数据集中的特征数据为输入信息,状态标签为标签信息,利用所述训练集对初始的固态硬盘状态预测模型进行训练,得到训练后的固态硬盘状态预测模型,以及利用所述测试集对训练后的固态硬盘状态预测模型进行测试。
2.根据权利要求1所述的方法,其特征在于,固态硬盘状态预测模型包括时序数据特征编码模块、图像编码器、文本编码器、特征融合模块和预测输出模块,其中,时序数据特征编码模块、图像编码器、文本编码器分别与特征融合模块连接,所述特征融合模块与所述预测输出模块连接,所述时序数据特征编码模块用于对时间序列数据进行特征编码,得到对应的数据特征向量,作为第1模态特征向量;所述图像编码器用于对图像数据进行特征编码,得到对应的图像特征向量,作为第2模态特征向量;所述文本编码器用于对基本信息进行特征编码,得到对应的文本特征向量,作为第3模态特征向量;所述特征融合模块用于对接收到的第1模态特征向量、第2模态特征向量和第3模态特征向量进行融合,得到模态融合特征向量,并输入给所述预测输出模块,所述预测输出模块用于对接收到的模态融合特征向量进行线性转换,得到对应的线性转换值,并将线性转换值进行映射处理,得到固态硬盘的状态预测值。
3.根据权利要求2所述的方法,其特征在于,所述特征融合模块具体用于执行如下操作:
S10,将接收到的第i模态特征向量分别与第i模态特征向量对应的第一变换权重矩阵、第二变换权重矩阵和第三变换权重矩阵作点积,得到第i模态特征向量对应的第一变换特征向量、第二变换特征向量和第三变换特征向量;i的取值为1到3;第一变换权重矩阵、第二变换权重矩阵和第三变换权重矩阵均为可学习的权重矩阵;
S20,将第i模态特征向量对应的第一变换特征向量分别与第j模态特征向量的第二变换特征向量作点积,得到第i模态特征向量对应的第一相关系数向量R1i=(R1i1,R1i2,R1i3);
R1ir为第i模态特征向量和第r模态特征向量之间的相关系数,r的取值为1到3;
S30,基于R1i,获取第i模态特征向量的第二相关系数向量R2i=(R2i1,R2i2,R2i3);R2ir=R1ir/dr,dr为第r模态特征向量对应的第二变换特征向量的维度;
S40,基于R2i,获取第i模态特征向量的第三相关系数向量R3i=(R3i1,R3i2,R3i3);R3ir=3
exp(R2ir)/∑h=1exp(R2ih),R2ih为R2i中的第h个相关系数,h的取值为1到3,exp()为指数函数;
S50,获取第i模态特征向量的输出特征向量Fi=(Fi1,Fi2,Fi3),Fir为Fi中的第r个输出特征,Fir=R3i1×F31r+R3i2×F32r+R3i3×F33r,F3sr为第s模态特征向量对应的第三变换特征向量中的第r个特征;
S60,将第i模态特征向量和对应的输出特征向量相加,得到第i模态特征向量的最终特征向量,作为第i模态最终特征向量;得到融合特征矩阵M,M的大小为q×3,M的第r行数据为第i模态最终特征向量,q为每个模态最终特征向量的维度大小;
S70,基于M获取模态融合特征向量FM=(FM1,FM2,……,FMx,……,FMq),FMx为FM中的第x个特征,x的为取值为1到q,FMx为M中的第x列数据的平均值。
4.根据权利要求2所述的方法,其特征在于,所述状态预测值满足如下条件:
‑y ‑1
S=(1+e ) ;S为状态预测值,e为自然数,y为线性转换值,y=FM×W+b,W为可学习的权重矩阵,b为偏置项。
5.根据权利要求1所述的方法,其特征在于,在S200中,对抗样本数据基于经训练后的对抗样本生成模型生成,其中,输入到经训练后的对抗样本生成模型中的数据包括待处理数据中的图像数据和文本融合数据,文本融合数据为将待处理的数据中的时序数据和文本数据拼接在一起得到的数据;
其中,对抗样本生成模型包括第一特征编码模块、第二特征编码模块、特征合并模块、生成器和判别器,其中,第一特征编码模块用于将接收的文本融合数据中的文本数据转换为数值形式特征,得到文本融合数据特征矩阵,并输入给所述特征合并模块;第二特征编码模块用于将接收的图像数据转换为数值形式特征,得到图像数据特征矩阵,并输入给所述特征合并模块;所述特征合并模块用于将接收到的文本融合数据特征矩阵和图像数据特征矩阵进行相乘,得到合并矩阵,并输入给生成器;所述生成器用于对接收到的合并矩阵添加随机噪声,并基于添加了随机噪声的合并矩阵生成对抗样本数据,并输入给所述判别器;所述判别器用于对接收到的对抗样本数据的真实性进行判别,得到对应的判别值。
6.根据权利要求5所述的方法,其特征在于,所述生成器包括依次连接的噪声添加模块、全连接层、第一反卷积层、第二反卷积层和第三反卷积层,所述判别器包括依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层和全连接层;
其中,在对抗样本生成模型的训练过程中,当对抗样本数据和真实的样本数据之间的初始分数大于设定分数阈值,并且对抗样本数据和真实的样本数据之间的初始距离小于设定距离阈值时,模型训练结束。
7.根据权利要求1所述的方法,其特征在于,所述关键参数通过如下步骤获取得到:
S1,基于原始数据集,所述原始数据集包括固态硬盘在设定时间段内的状态标签和SMART日志数据,分别利用N种相似度计算方法获取SMART日志数据中的Z个参数和固态硬盘的状态之间的相似度,得到Z个相似度集;N≥2;
N
S2,获取Z个参数中的第u个参数的第一权重Wu=∑v=1Puv,得到Z个第一权重;Puv为第u个参数在第v个相似度集中的位置,u的取值为1到Z,v的取值为1到N;
S3,将Z个第一权重按照由大到小的顺序进行排序,并将排序后的Z个第一权重中的前n1个权重对应的n1个参数作为候选参数,n1<Z;
S4,将n1个候选参数对应的原始数据作为训练数据,对随机森林模型进行训练,得到n1个候选参数的第二权重;
S5,将n1个第二权重按照由大到小的顺序进行排序,并将排序后的n1个第二权重中的前n2个权重对应的n2个候选参数作为所述关键参数,n2<n1。
8.根据权利要求7所述的方法,其特征在于,候选参数通过如下步骤获取:
步骤1,利用当前的中间参数集对应的原始数据对当前的AI模型进行训练,得到当前固态硬盘的状态预测结果;当前的中间参数集的初始值为Z个中间参数中的第1个参数,Z个中间参数为排序后的Z个第一权重对应的Z个参数,当前的AI模型为初始化的AI模型;
步骤2,基于当前固态硬盘的状态预测结果和对应的真实结果,获取当前的AI模型的预测准确率,并加入到当前的准确率集中,如果当前的准确率集中的最后Q个的预测准确率中的任意两个预测准确率之间的差值均小于设定差值,将当前的中间参数集的参数作为候选参数,否则,将Z个中间参数中位于当前的中间参数集中的最后一个参数之后的中间参数加入到当前的中间参数集中,执行步骤1。
9.根据权利要求1所述的方法,其特征在于,所述基本信息包括硬盘型号、供应商、磨损级别、开机时间。