1.一种患肝癌风险等级快速预测装置,其特征在于,包括数据采集模块、数据库、数据处理模块和风险评估模块;
所述数据采集模块采集测试者基本数据,并将测试者基本数据存储到数据库的初步数据矩阵P;
所述数据处理模块调取并处理数据库中的初步数据矩阵P,得到样本数据矩阵P′,并输入到风险评估模块中;
所述风险评估模块存储有肝癌风险评估模型;
所述肝癌风险评估模型对样本数据矩阵P′进行处理,输出风险评估结果y;风险评估结果y=0表示无高风险,风险评估结果y=1表示高风险;
所述测试者基本数据包括测试者特征数据和肝癌风险数据;
所述测试者特征数据包括身高、体重、每周饮食摄入量和既往病史数值化结果;
既往病史数值化的标准为:判断既往疾病影响风险评估结果的概率,若概率大于50%,则将测试者基本数据数值化为2,相反,则将测试者基本数据数值化为1;
所述初步数据矩阵P如下所示:
式中,ANα为初步数据矩阵P中元素;矩阵P的列下标为特征类别序号;行下标为测试者编号;α为测试者特征数据类别总数;
初步数据矩阵P中元素下标存储在标签矩阵B中;
所述数据处理模块处理数据库中的初步数据矩阵P的步骤如下:I)判断初步数据矩阵P第g行是否缺失元素,若是,则删除第g行和标签矩阵B中与第g行元素下标相同的元素;若否,则保留第g行元素;g初始值为1;
II)令g=g+1,并返回步骤I),直至g=N+1;
*
III)基于步骤I)和步骤II),建立更新后的初步数据矩阵P;
*
IV)利用近邻成分分析算法提取初步数据矩阵P中影响患肝癌风险最高的β个特征,并建立样本数据矩阵P′;β≤α,M≤N;
样本数据矩阵P′如下所示:
建立肝癌风险评估模型的步骤如下:
1)随机提取样本数据矩阵P′中的c行数据构成训练样本矩阵C;
随机提取训练样本数据矩阵P′中的d行数据构成测试样本矩阵D;
2)确定SVM的目标函数fw,b(xi),即:T
fw,b(xi)=w·xi+b; (3)式中,w为权重;b为偏置;xi为训练样本,即训练样本矩阵C中的第i行元素;xi对应的标签矩阵记为Bi;i=1,2,...,c;
其中,当fw,b(xi)>0时,yi=1;当fw,b(xi)<0时,yi=‑1;yi为第i位测试者的患肝癌风险等级类别;
3)计算空间中任意样本xi到目标函数的距离r,即:两个异类支持向量到超平面的距离之和margin如下所示:
4)确定SVM的约束条件,即:
5)利用拉格朗日乘子ai≥0构造拉格朗日函数,即:式中,a为待调整参数;
6)基于公式7,将公式6简化如下:
7)基于步骤1至6,建立肝癌风险评估模型;
8)将训练样本矩阵C和标签矩阵Bi输入到公式8中,完成肝癌风险评估模型的参数调整;
所述参数包括权重w和、偏置b和待调整参数a;
9)将测试样本矩阵D和标签矩阵Bj输入到调整自学习参数后的肝癌风险评估模型中,计算肝癌风险模型的预测准确率P,即:式中,TP为模型正确预测的样本数;FP为模型错误预测的样本数。
2.根据权利要求1所述的一种患肝癌风险等级快速预测装置,其特征在于,还包括计算机可读介质;
所述计算机可读介质内写入数据库所有数据。