1.一种预测硬盘异常状态的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:S100,获取目标硬盘对应的目标硬盘数据列表集,其中,所述目标硬盘为待检测硬盘,所述目标硬盘数据列表集包括若干个目标硬盘数据列表,所述目标硬盘数据列表包括若干个目标硬盘数据,所述目标硬盘数据为基于初始硬盘运行特征获取到的目标硬盘对应的SMART数据,其中,所述初始硬盘运行特征为硬盘在运行时表征出的特征;
S200,根据目标硬盘数据列表集,获取第一硬盘数据列表和第二硬盘数据列表,其中,所述第一硬盘数据列表包括若干个第一硬盘数据,所述第一硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且处于异常状态的SMART数据,所述第二硬盘数据列表包括若干个第二硬盘数据,所述第二硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且除第一硬盘数据之外的SMART数据,其中,在S200中通过如下步骤获取目标硬盘运行特征:S201,获取关键硬盘数据列表集A={A1,……,Ai,……,An},Ai={Ai1,……,Aij,……,Aim},其中,Aij为第i个关键硬盘对应的第j个关键硬盘数据列表,所述关键硬盘数据列表包括若干个关键硬盘数据,所述关键硬盘数据为基于初始硬盘运行特征获取到的关键硬盘对应的SMART数据,j=1……m,m为初始硬盘运行特征的数量,i=1……n,n为关键硬盘的数量,所述关键硬盘为存在异常状态的用于训练获取目标硬盘运行特征的硬盘;
1 i n i i
S203,根据A,获取A对应的候选得分列表集B={B,……,B ,……,B },B ={B 1,……,i i i i i i iBr,……,Bs},Br={Br1,……,Brj,……,B rm},Brj为Ai对应的第r类候选得分列表中的第j个候选得分,r=1……s,s为候选得分类型的数量,其中,所述候选得分为基于A利用不同的i特征重要性获取算法获取到的每个初始硬盘运行特征对应的得分,其中,s=5,当r=1时,B1j为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之i间关系强度获取到的得分,当r=2时,B2j为第i个关键硬盘基于第j个初始硬盘运行特征对i应的数据与关键硬盘对应的标签数据之间相关方向获取到的得分,当r=3时,B 3j为基于随机森林模型获取到的第i个关键硬盘在第j个初始硬盘运行特征对应的数据中加入噪声数i据后分类精度降低的程度,当r=4时,B4j为基于XGBoot模型获取到的第i个关键硬盘对应的i第j个初始硬盘运行特征对应的得分,当r=5时,B5j为基于Relief特征选择算法获取到的第i个关键硬盘对应的第j个初始硬盘运行特征对应的得分;
0 0 0 0 0
S205,根据A和B,获取候选优先级列表D ={D 1,……,Dj,……,D m},Dj为第j个初始硬0
盘运行特征对应的候选优先级,其中,Dj符合如下条件:i i
,ω rj为Brj对应的数值中小数部分从小数第一位开始到i i
第一个非零的数所包括的数字的数量,ɛ rj为将Br中的候选得分按照从大到小的顺序进行i排序后Brj所在位置对应的序号;
0
S207,根据D ,获取目标优先级列表D={D1,……,Di,……,Dn},Di为第i个初始硬盘运行特征对应的目标优先级,其中,Di符合如下条件:
0 1 2 1 1 0 2 0
Di=(Di‑D)/(D‑D),其中,D为D中最小的候选优先级,D为D中最大的候选优先级;
S209,当Di≥FD时,获取对应的初始硬盘运行特征为目标硬盘运行特征,其中,FD为预设的优先级阈值;
S300,将第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,其中,所述第三硬盘数据列表包括若干个第三硬盘数据,所述第三硬盘数据为对第一硬盘数据进行数据增强获取到的数据,所述第一模块为进行数据增强的模块;
S400,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据以实现对目标硬盘异常状态的预测,其中,所述第二模块为获取目标硬盘标签数据的模块。
i
2.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,ɛ rj的取值范围为1到m。
3.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,FD的取值范围为0.05~0.1。
4.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,当硬盘处于异常状态时,标签数据为“1”;当硬盘处于正常状态时,标签数据为“0”。
5.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,在S300中通过如下步骤获取第一模块:S1,获取样本硬盘数据列表,其中,所述样本硬盘数据列表包括若干个样本硬盘数据,所述样本硬盘数据为样本硬盘处于异常状态时对应的SMART数据,所述样本硬盘为用于训练的硬盘;
S2,根据样本硬盘数据列表,获取第一样本硬盘数据列表P和第二样本硬盘数据列表Q,其中,所述第一样本硬盘数据列表P中包括若干个第一样本硬盘数据,所述第一样本硬盘数据为从样本硬盘数据列表中获取到的与时间无关联关系的样本硬盘数据,所述第二样本硬盘数据列表Q中包括若干个第二样本硬盘数据,所述第二样本硬盘数据为从样本硬盘数据列表中获取到的与时间有关联关系的样本硬盘数据;
1
S3,将P和Q输入至生成器中,获取第一候选优先级L,其中,在S3中通过如下步骤获取第1
一候选优先级L:
1
S31,将P输入至编码函数中获取P对应的编码数据列表P;
1 0
S32,将P输入至解码函数中进行解码以获取到P对应的解码数据列表P;
1
S33,将Q输入至上述编码函数中获取Q对应的编码数据列表Q;
1 0
S34,将Q输入至上述解码函数中进行解码以获取到Q对应的解码数据列表Q;
0 0 1 1
S35,根据P和Q ,获取第一候选优先级L ,其中,所述第一候选优先级L 为P中的每个数
0 0
据与P中每个对应位置数据之间的相似度以及Q中每个数据与Q中每个对应位置数据之间的相似度之和;
1
S4,不断调整生成器中的参数,直到L最小时获取第一向量列表和第二向量列表,其中,所述第一向量列表包括若干个第一向量,所述第一向量为基于P中的第一样本硬盘数据随机生成的向量,所述第二向量列表包括若干个第二向量,所述第二向量为基于Q中的第二样本硬盘数据随机生成的向量;
S5,将第一向量列表和第二向量列表输入至调参后的生成器中,获取第一向量列表对应的编码向量列表E和第二向量列表对应的编码向量列表F;
1
S6,将P和E输入至鉴别器中,获取P对应的第一指定数据列表,其中,所述第一指定数据列表包括若干个第一指定数据,所述第一指定数据为将第一样本硬盘数据对应的编码数据和第一向量对应的编码向量通过鉴别器中的对抗函数获取到的分类结果;
1
S7,将Q和F输入至鉴别器中,获取Q对应的第二指定数据列表,其中,所述第二指定数据列表包括若干个第二指定数据,所述第二指定数据为将第二样本硬盘数据对应的编码数据和第二向量对应的编码向量通过鉴别器中的对抗函数获取到的分类结果;
2
S8,根据第一指定数据列表和第二指定数据列表,获取第二候选优先级L,其中,所述第2
二候选优先级L 为根据第一指定数据列表和第二指定数据列表获取到的鉴别器识别P、Q、E和F的准确度;
2 3
S9,不断调整鉴别器中的参数,直到L 最大时获取第三候选优先级L,其中,第三候选优3
先级L为P和E之间的相似度以及Q和F之间的相似度之和;
3
S10,不断调整预设的初始模块的参数,直到第三候选优先级L最小时以获取第一模块。
6.根据权利要求5所述的预测硬盘异常状态的系统,其特征在于,所述编码函数和解码函数通过LSTM模型实现。