1.一种基于XGBoost的数据分类方法,其特征在于,包括:
从调查数据库中提取待分类疾病对应的调查数据,作为初始数据;
采用XGBoost模型对所述初始数据进行特征提取,得到所述调查数据的目标特征;
使用所述目标特征对所述XGBoost模型进行模型训练,并在所述XGBoost模型中使用Hyperopt库进行模型调参,得到训练好的分类模型;
根据所述目标特征,生成分类筛选问卷;
针对任一用户,将所述用户回答所述分类筛选问卷得到的数据,作为用户的目标数据,并将所述目标数据输入所述训练好的分类模型中,得到所述用户对应的分类。
2.根据权利要求1所述的基于XGBoost的数据分类方法,其特征在于,所述采用XGBoost模型对所述初始数据进行特征提取,得到所述调查数据的目标特征包括:基于所述XGBoost模型,对所述初始数据进行特征提取,得到M个基础特征,其中,M为正整数;
根据逐步回归算法,将M个所述基础特征添加到所述XGBoost模型中进行迭代计算,得到迭代计算结果,其中,所述迭代计算结果中包含所述基础特征对应的贡献分值;
从所述迭代计算结果中,将所述贡献分值按照从大到小的顺序排列,选取排名前N个贡献分值,并将所述前N个贡献分值所对应的基础特征作为N个目标特征,其中,N
3.根据权利要求2所述的基于XGBoost的数据分类方法,其特征在于,所述基于所述XGBoost模型,对所述初始数据进行特征提取,得到M个基础特征,其中,M为正整数包括:基于所述XGBoost模型,对所述初始数据进行集成树计算分析,得到K个分析特征,其中,每个所述分析特征经过计算分析后具有分割得分,K为正整数,K>M;
删除分割得分为零的分析特征,将保留下来的分析特征作为所述基础特征,得到M个所述基础特征。
4.根据权利要求2所述的基于XGBoost的数据分类方法,其特征在于,所述根据逐步回归算法,将M个所述基础特征添加到所述XGBoost模型中进行迭代计算,得到迭代计算结果包括:根据逐步回归算法,将M个所述基础特征逐步添加到XGBoost模型中进行迭代计算,其中,每次迭代计算得到一个特征值;
当检测到所述特征值不再上升时,统计所述基础特征对所述XGBoost模型计算后得到的所述贡献分值。
5.根据权利要求4所述的基于XGBoost的数据分类方法,其特征在于,在所述根据逐步回归算法,将M个所述基础特征逐步添加到XGBoost模型中进行迭代计算之后,所述方法还包括:通过嵌套交叉验证的方式,对所述XGBoost模型进行验证。
6.根据权利要求1至5任一项所述的基于XGBoost的数据分类方法,其特征在于,所述针对任一用户,将所述用户回答所述分类筛选问卷得到的数据,作为用户的目标数据,并将所述目标数据输入所述训练好的分类模型中,得到所述用户对应的分类还包括:将所述分类筛选问卷以二维码链接的形式发送到所述目标用户,获取所述目标用户的所述目标数据,所述目标数据存储于区块链中。
7.一种基于XGBoost的数据分类装置,其特征在于,包括:
初始数据获取模块,用于从调查数据库中提取待分类疾病对应的调查数据,作为初始数据;
目标特征提取模块,用于采用XGBoost模型对所述初始数据进行特征提取,得到所述调查数据的目标特征;
分类模型训练模块,用于使用所述目标特征对所述XGBoost模型进行模型训练,并在所述XGBoost模型中使用Hyperopt库进行模型调参,得到训练好的分类模型;
分类筛选问卷模块,用于根据所述目标特征,生成分类筛选问卷;
用户分类获取模块,用于针对任一用户,将所述用户回答所述分类筛选问卷得到的数据,作为用户的目标数据,并将所述目标数据输入所述训练好的分类模型中,得到所述用户对应的分类。
8.根据权利要求7所述的基于XGBoost的数据分类装置,其特征在于,所述目标特征提取模块包括:基础特征获取单元,用于基于所述XGBoost模型,对所述初始数据进行特征提取,得到M个基础特征,其中,M为正整数;
迭代计算结果单元,用于根据逐步回归算法,将M个所述基础特征添加到所述XGBoost模型中进行迭代计算,得到迭代计算结果,其中,所述迭代计算结果中包含所述基础特征对应的贡献分值;
目标特征获取单元,用于从所述迭代计算结果中,将所述贡献分值按照从大到小的顺序排列,选取排名前N个贡献分值,并将所述前N个贡献分值所对应的基础特征作为N个目标特征,其中,N
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于XGBoost的数据分类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于XGBoost的数据分类方法。