1.一种分群处理方法,其特征在于,包括:
获取待分群的个体样本数据,利用预设分群决策树建立至少两个群体知识库;每一个所述群体知识库中均包含与所有所述个体样本数据关联的群体知识,所述个体样本数据中包括多个个体特征;至少两个所述群体知识库中与同一个所述个体样本数据关联的群体知识相互冲突;
通过特征贡献度评估器的预测短期结局模型调用SHAP方法评估所述个体样本数据中个体特征的短期贡献,通过所述特征贡献度评估器的预测长期结局模型调用SHAP方法评估所述个体样本数据中个体特征的长期贡献,将所述短期贡献和所述长期贡献输入至所述特征贡献度评估器的预设的贡献度函数后,输出所述个体特征的特征贡献度;所述特征贡献度评估器基于XGBoost模型的SHAP方法建立;
获取所述个体样本数据与各所述群体知识库中相关联的所述群体知识之间的匹配关系,根据获取的所有所述匹配关系为所述个体样本数据标记样本群体值标签后,将所述个体样本数据的所有所述个体特征的特征贡献度输入至预设reward函数后,输出所述个体样本数据的reward值,并将所述个体样本数据的群体知识值标签定义为行为变量,将所述个体样本数据的个体特征定义为状态变量;
将所述个体样本数据的行为变量、状态变量和reward值输入至待训练预设分群决策模型的free‑stable DQN网络中的四层DQN网络进行依次训练,获取free‑stable DQN网络的输出层根据所述行为变量和所述状态变量生成Q值,并将所述个体样本数据的所述reward值和所述Q值输入至所述待训练预设 分群决策模型的损失函数后获取所述个体样本数据的损失值;所述四层DQN网络分别为输入层、两层隐藏层和输出层,且四层DQN网络为全连接;
在判定所述个体样本数据在经历过预设训练早停系数后所述损失值不再下降时,将所述待训练预设 分群决策模型标记为训练完成的分群决策模型;
获取待确定群体的个体数据,并获取所述个体数据中与至少两个群体知识库一一对应的至少两个分群决策结果;一个所述群体知识库包含至少一个确定群体,所述分群决策结果是指所述个体数据属于所述群体知识库中包含的其中一个所述确定群体;一个所述确定群体与一个所述群体知识库中的一个群体知识关联;所述确定群体包括多种饮食群体;所述个体数据是指所述确定群体对应的个体特征,所述个体特征包括健康情况个体特征、饮食情况个体特征、短期结局个体特征和长期结局个体特征;所述群体知识库中的群体知识为饮食方式推荐的人群划分方式;
若至少两个所述分群决策结果不一致,则将所述个体数据输入至所述分群决策模型后,得到所述分群决策模型输出的最终分群结果;所述最终分群结果与其所属的个体数据的群体值标签关联;
若至少两个所述分群决策结果均一致,则确定该分群决策结果为所述个体数据的最终分群结果。
2.根据权利要求1所述的分群处理方法,其特征在于,所述获取待分群的个体样本数据,包括:
获取预设时间段的所有所述个体样本数据,并在预设数据图谱中以所述个体样本数据查询出至少一个预设个体特征项目,并以预设个体特征项目收集所述个体特征。
3.根据权利要求1所述的分群处理方法,其特征在于,所述通过所述特征贡献度评估器的预测短期结局模型调用SHAP方法评估所述个体样本数据中个体特征的短期贡献,通过所述特征贡献度评估器的预测长期结局模型调用SHAP方法评估所述个体样本数据中个体特征的长期贡献,包括:获取所述个体样本数据对应于至少两个所述群体知识库的至少两个分群决策结果;一个所述群体知识库包含至少一个群体,所述分群决策结果为所述个体样本数据属于所述群体知识库包含的一个所述群体;一个所述群体与一个所述群体知识关联;
若至少两个所述分群决策结果不一致,则通过特征贡献度评估器的预测短期结局模型调用SHAP方法评估所述个体样本数据中个体特征的短期贡献,通过所述特征贡献度评估器的预测长期结局模型调用SHAP方法评估所述个体样本数据中个体特征的长期贡献。
4.根据权利要求3所述的分群处理方法,其特征在于,所述获取所述个体样本数据对应于至少两个所述群体知识库的至少两个分群决策结果之后,还包括:若至少两个所述分群决策结果均一致,则删除所述个体样本数据。
5.一种分群处理装置,其特征在于,包括如下模块:
建立模块,用于获取待分群的个体样本数据,利用预设分群决策树建立至少两个群体知识库;每一个所述群体知识库中均包含与所有所述个体样本数据关联的群体知识,所述个体样本数据中包括多个个体特征;至少两个所述群体知识库中与同一个所述个体样本数据关联的群体知识相互冲突;
输出模块,用于通过特征贡献度评估器的预测短期结局模型调用SHAP方法评估所述个体样本数据中个体特征的短期贡献,通过所述特征贡献度评估器的预测长期结局模型调用SHAP方法评估所述个体样本数据中个体特征的长期贡献,将所述短期贡献和所述长期贡献输入至所述特征贡献度评估器的预设的贡献度函数后,输出所述个体特征的特征贡献度;
所述特征贡献度评估器基于XGBoost模型的SHAP方法建立;
定义模块,用于获取所述个体样本数据与各所述群体知识库中相关联的所述群体知识之间的匹配关系,根据获取的所有所述匹配关系为所述个体样本数据标记样本群体值标签后,将所述个体样本数据的所有所述个体特征的特征贡献度输入至预设reward函数后,输出所述个体样本数据的reward值,并将所述个体样本数据的群体知识值标签定义为行为变量,将所述个体样本数据的个体特征定义为状态变量;
获取模块,用于将所述个体样本数据的行为变量、状态变量和reward值输入至待训练预设分群决策模型的free‑stable DQN网络中的四层DQN网络进行依次训练,获取free‑stable DQN网络根据所述行为变量和所述状态变量生成Q值,并将所述个体样本数据的所述reward值和所述Q值输入至所述待训练预设 分群决策模型的损失函数后获取所述个体样本数据的损失值;所述四层DQN网络分别为输入层、两层隐藏层和输出层,且四层DQN网络为全连接;
标记模块,用于在判定所述个体样本数据在经历过预设训练早停系数后所述损失值不再下降时,将所述待训练预设 分群决策模型标记为训练完成的分群决策模型;
分群决策结果获取模块,用于获取待确定群体的个体数据,并获取所述个体数据中与至少两个群体知识库一一对应的至少两个分群决策结果;一个所述群体知识库包含至少一个确定群体,所述分群决策结果是指所述个体数据属于所述群体知识库中包含的其中一个所述确定群体;一个所述确定群体与一个所述群体知识库中的一个群体知识关联;所述确定群体包括多种饮食群体;所述个体数据是指所述确定群体对应的个体特征,所述个体特征包括健康情况个体特征、饮食情况个体特征、短期结局个体特征和长期结局个体特征;所述群体知识库中的群体知识为饮食方式推荐的人群划分方式;
输入模块,用于若至少两个所述分群决策结果不一致,则将所述个体数据输入至所述分群决策模型后,得到所述分群决策模型输出的最终分群结果;所述最终分群结果与其所属的个体数据的群体值标签关联;
最终分群结果确定模块,用于若至少两个所述分群决策结果均一致,则确定该分群决策结果为所述个体数据的最终分群结果。
6.根据权利要求5所述的分群处理装置,其特征在于,所述输出模块包括:
获取子模块,用于获取所述个体样本数据对应于至少两个所述群体知识库的至少两个分群决策结果;一个所述群体知识库包含至少一个群体,所述分群决策结果为所述个体样本数据属于所述群体知识库包含的一个所述群体;一个所述群体与一个所述群体知识关联;
评估子模块,用于若至少两个所述分群决策结果不一致,则通过特征贡献度评估器的预测短期结局模型调用SHAP方法评估所述个体样本数据中个体特征的短期贡献,通过所述特征贡献度评估器的预测长期结局模型调用SHAP方法评估所述个体样本数据中个体特征的长期贡献。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至
4中任一项所述分群处理方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述分群处理方法。