利索能及
我要发布
收藏
专利号: 2020114625278
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种文本推荐方法,其特征在于,所述方法包括:获取多个文本,并将每个文本输入预训练模型中进行编码,得到每个文本的多个语句向量;

基于注意力机制融合每个文本的多个语句向量和语义向量得到每个文本的文本向量;

计算每个文本的独热编码并基于每个文本的文本向量及独热编码训练文本主题分类模型,并通过所述文本主题分类模型输出文本主题矩阵,其中,所述文本主题矩阵中的每行向量对应一个主题向量;

获取用户的阅读习惯向量,并根据每个文本的文本向量及对应的主题向量和所述阅读习惯向量生成文本特征;

基于多个所述文本特征训练XGBOOST,得到文本推荐模型;

根据所述文本推荐模型输出的文本阅读概率矩阵为所述用户推荐文本。

2.如权利要求1所述的文本推荐方法,其特征在于,所述基于注意力机制融合每个文本的多个语句向量和语义向量得到每个文本的文本向量包括:采用如下公式基于注意力机制计算每个文本的每个语句向量与对应文本的语义向量之间的匹配度,ei=hiAr,A为随机初始化的一个对角矩阵;r为随机初始化的文本的语义向量,hi为对应文本的第i个语句的语句向量,ei为匹配度;

采用如下公式根据所述匹配度计算每个文本的每个语句向量的语句权重,αi表示第i个语句在整个文本中的语句权重,K为文本的总数目;

采用如下公式根据每个文本的每个语句向量的语句权重计算每个文本的文本向量,d=∑iαihi,d表示文本向量。

3.如权利要求2所述的文本推荐方法,其特征在于,所述计算每个文本的独热编码包括:

获取每个文本对应的真实文本主题;

为每个真实文本主题生成真实文本主题标签;

计算所述真实文本主题标签的数量;

根据所述数量生成N位状态寄存器;

使用所述N位状态寄存器计算每个文本对应的真实文本主题标签的独热编码。

4.如权利要求3所述的文本推荐方法,其特征在于,所述基于每个文本的文本向量及独热编码训练文本主题分类模型包括:将所述多个文本的文本向量输入全连接神经网络中;

通过所述全连接神经网络计算每个文本属于每个文本主题的条件概率;

根据每个文本属于每个文本主题的条件概率及对应的独热编码生成风险损失函数;

通过梯度下降算法迭代计算所述风险损失函数的风险损失值;

当所述风险损失值达到最小时,结束训练,得到文本主题分类模型。

5.如权利要求4所述的文本推荐方法,其特征在于,所述全连接神经网络采用如下公式计算每个文本属于每个文本主题的条件概率: 其中,O=Md+b,ot为文本主n×1 n×dim

题t的分数,O∈R 为随机初始化的文本主题得分分布向量,n为文本主题的个数,M∈Rdim×1

为随机初始化的文本主题矩阵,b∈R 为预先设置的偏置项,m为文本的主题向量;

所述根据每个文本属于每个文本主题的条件概率及对应的独热编码生成的风险损失函数为: z为每篇文本的真实文本主题标签的独热编码。

6.如权利要求1至5中任意一项所述的文本推荐方法,其特征在于,所述根据所述文本推荐模型输出的文本阅读概率矩阵为所述用户推荐文本包括:获取所述文本阅读概率矩阵中大于预设文本阅读概率阈值的目标文本阅读概率;

推荐所述目标文本阅读概率对应的文本至所述用户。

7.如权利要求1至5中任意一项所述的文本推荐方法,其特征在于,所述方法还包括:根据所述文本主题矩阵进行文本主题聚类;

提取每类文本主题下的每个文本的多个高频关键词;

获取用户对每个文本的点击次数;

根据所述每个文本的点击次数计算每个高频关键词的点击率;

根据每个高频关键词的点击率确定所述用户的关注点。

8.一种文本推荐装置,其特征在于,所述装置包括:文本编码模块,用于获取多个文本,并将每个文本输入预训练模型中进行编码,得到每个文本的多个语句向量;

向量融合模块,用于基于注意力机制融合每个文本的多个语句向量和语义向量得到每个文本的文本向量;

第一训练模块,用于计算每个文本的独热编码并基于每个文本的文本向量及独热编码训练文本主题分类模型,并通过所述文本主题分类模型输出文本主题矩阵,其中,所述文本主题矩阵中的每行向量对应一个主题向量;

特征生成模块,用于获取用户的阅读习惯向量,并根据每个文本的文本向量及对应的主题向量和所述阅读习惯向量生成文本特征;

第二训练模块,用于基于多个所述文本特征训练XGBOOST,得到文本推荐模型;

文本推荐模块,用于根据所述文本推荐模型输出的文本阅读概率矩阵为所述用户推荐文本。

9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的文本推荐方法。

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的文本推荐方法。