1.一种基于知识库的服刑人员个性化循证矫正推荐方法,其特征在于,具体包括以下步骤:
步骤一:服刑人员画像建模;
步骤二:在服刑人员画像建模和案例知识库的基础上,融合情景感知信息,结合张量分解算法和基于回归树的上下文自动编码技术,如式(2)所示,综合考虑服刑人员、矫正策略、上下文信息对矫正效果的影响;
其中,ymik和fmik表示服刑人员m在上下文k下对循证矫正策略i的实际打分和预测打分,bk表示上下文偏置,Umd表示服刑人员m的D维隐语义向量的第d个元素,Vid表示循证矫正策略i的D维隐语义向量的第d个元素,Ckd表示上下文k的D维隐语义向量的第d个元素;
所述案例知识库的构建包括以下三种方法:方法一:专家跟踪矫正案例,构成基本的专家标记的标准知识;
方法二:采用迁移学习法,将使用相关领域标准文本训练出的初始模型迁移到本案例知识库构建中,并结合专家标记的标准知识对初始模型进行优化,从而实现对非标准化案例进行自动语义识别;
方法三:采用在线增量学习法,结合实际使用过程中形成的矫正案例和矫正策略推荐系统推荐的矫正策略,在线提取案例知识和优化学习模型,持续对语义标识模型进行优化;
步骤三:利用终端设备干警干预信息和服刑人员交互信息,通过基于Q‑learning的强化学习框架对循证矫正方法进行不断的评估、反馈,动态调整矫正方法智能推荐算法模型,实现基于服刑人员全维度画像的循证矫正;
如式(3)所示,
Q(s,a)←Q(s,a)+α[r+βmaxα'Q(s',a')‑Q(s,a)] (3)其中,Q(s,a)代表在状态s下使用循证矫正策略a的回报,α代表学习率,r代表服刑人员改造情况的即时反馈,β是折扣因子;
步骤四:针对终端设备矫正资源,利用标签信息对矫正资源进行分析与筛选,形成面向服刑人员的完整矫正方案。
2.如权利要求1所述的一种基于知识库的服刑人员个性化循证矫正推荐方法,其特征在于,所述步骤一具体包括以下步骤:
1.1:自大规模服刑人员用户中完成信息的收集与处理,收集服刑人员关于年龄、性别的静态数据;收集服刑人员关于心理、生理的动态数据;
1.2:对收集到的服刑人员的动态、静态数据进行预处理;
1.3:利用服刑人员关于年龄、性别以及案例记录的静态数据,通过式(1)所示的TF‑IDF算法,进行特征关键词提取生成服刑人员的个性化标签,完成用户静态属性建模;利用服刑人员关于心理、生理的动态数据,通过逻辑回归算法进行用户动态行为建模;从静态和动态两个方面刻画服刑人员画像,构建服刑人员全维度画像模型,其中,nij代表该词在文件dj中出现的次数,∑knk,j代表文件dj中所有词汇出现的次数总和,|D|代表是语料库中的文件总数,{j:ti∈dj}代表包含词ti的文件数目。