1.一种可解释、可交互的用户画像方法,其特征在于:该方法包括:S10:按照可解释的方法构建用户画像标签;
S20:使用Hive存储用户画像标签相关数据;
S30:利用ECharts让用户画像面向用户可视化、可反馈;
S40:根据用户对用户画像的调整,反馈用户意见给系统进行优化;
S50:采用反歧视以及准确性测试,检验用户画像的性能;
所述S20具体为:
建立Hive用户标签表,确定标签的名称、内容、解释栏;
将计算出的用户标签向量值插入Hive用户标签表“内容”中,将对标签的自然语言解释放在用户标签表中的“解释栏”;
所述S30具体为:
引入ECharts文件,指定使用雷达图;
雷达图的指示器为Hive数据仓库中存储的用户标签,雷达图的数据为每个用户在对应的用户标签上所得分数;
在雷达图的轴线上设置展开字段,展开字段的关键词为“解释”,内容为对应的解释,来源于Hive用户标签表中的解释栏;
在雷达图指示器上设置点击事件,点击后出现留言表,用户能够输入对用户画像的异议与其他反馈;
反馈界面使用LinearLayout进行布局,并且指定反馈框适应屏幕;
所述S50具体为:
对用户画像的反歧视性、准确性、反馈机制进行测试,其中,抽取相同量的正常群体和弱势群体的样本,对比正常群体和弱势群体在暴力指数标签、信用指数和犯罪可能性指数的敏感标签的平均指数差异,测试用户画像的对弱势群体的反歧视性;
使用交叉验证测试统计类标签以及规则类标签的准确性,使用抽样验证测试开发挖掘类标签的准确性;
分类用户的反馈内容,对每一类别都抽取一定反馈用户的样本,将每类分为A、B两组,A组为用户反馈之前的活跃度,B组为用户反馈之后的活跃度,将A、B两组进行对比,测试反馈机制运行效果。
2.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S10具体为:确定使用的标签类别,包括统计类标签、规则类标签、挖掘类标签;
在构建用户画像时,对用户画像的标签进行自然语言解释,包括对标签类别、标签数据来源、标签推理规则进行解释;
按照解释的难度确定标签所占的比例分别为统计类标签50%、规则类标签30%、挖掘类标签20%。
3.根据权利要求2所述的一种可解释、可交互的用户画像方法,其特征在于:所述确定使用的标签类别中,挖掘类标签利用隐因子模型LFM以及TF‑IDF挖掘数据,提交Spark任务进行计算。
4.根据权利要求1所述的一种可解释、可交互的用户画像方法,其特征在于:所述S40具体为:使用python工具对用户的反馈意见进行文本分词处理;
基于TF‑IDF算法对反馈意见进行主题词抽取,得出用户的反馈数据文件;
基于反馈数据,调整用户的标签向量值,更新用户画像;
基于更新后的用户画像进行推荐。
5.一种可解释、可交互的用户画像装置,其特征在于:该装置包括:用户画像解释模块,用于构建用户画像时,对用户画像的标签进行自然语言解释,包括解释内容单元、比例单元;所述解释内容单元包括对用户画像的标签进行自然语言解释,确定解释标签类别、标签数据来源、标签推理规则三项,并确定使用的标签类别,包括统计类标签、规则类标签、挖掘类标签;所述比例单元包括按照解释的难度确定标签所占的比例分别为统计类标签50%、规则类标签30%、挖掘类标签20%;
用户画像存储模块,用于建立Hive用户标签表,存储标签的名称、内容、解释;将计算出的用户标签向量值插入Hive用户标签表“内容”中,将对标签的自然语言解释放在用户标签表中的“解释栏”;
面向用户可视化及反馈模块,用于建立ECharts雷达图,使用户画像及其解释对用户可见,并且支持用户输入对用户画像的异议与其他反馈;雷达图的指示器为Hive数据仓库中存储的用户标签,雷达图的数据为每个用户在对应的用户标签上所得分数;在雷达图的轴线上设置展开字段,展开字段的关键词为“解释”,内容为对应的解释,来源于Hive用户标签表中的解释栏;在雷达图指示器上设置点击事件,点击后出现留言表,用户能够输入对用户画像的异议与其他反馈;反馈界面使用LinearLayout进行布局,并且指定反馈框适应屏幕;
用户画像优化模块,用于根据用户对用户画像的反馈,使用python工具、TF‑IDF算法调整用户的标签向量值,更新用户画像;
验证模块,用于对用户画像的反歧视性、准确性、反馈机制进行测试,包括反歧视验证单元、准确性验证单元、反馈机制验证单元;所述反歧视验证单元,用于对正常群体和弱势群体在敏感标签的平均指数差异测试反歧视性;所述准确性验证单元,用于使用交叉验证测试统计类标签以及规则类标签的准确性,使用抽样验证测试开发挖掘类标签的准确性,所述反馈机制验证单元用于使用A、B分组对比测试反馈机制效果;
其中,所述反歧视验证单元抽取相同量的正常群体和弱势群体的样本,对比正常群体和弱势群体在暴力指数标签、信用指数和犯罪可能性指数的敏感标签的平均指数差异,测试用户画像的对弱势群体的反歧视性;
准确性验证单元使用交叉验证测试统计类标签以及规则类标签的准确性,使用抽样验证测试开发挖掘类标签的准确性;
反馈机制验证单元分类用户的反馈内容,对每一类别都抽取一定反馈用户的样本,将每类分为A、B两组,A组为用户反馈之前的活跃度,B组为用户反馈之后的活跃度,将A、B两组进行对比,测试反馈机制运行效果。
6.一种电子设备,其特征在于,所述电子设备中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1~4中任一项所述方法中的步骤。