买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种微博异构信息的用户画像构建方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种微博异构信息的用户画像构建方法

￥16800

专利号： 2021103569029

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-06-16

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种微博异构信息的用户画像构建方法，其特征在于，分别构建文本及图像分类网络，对于微博用户内容进行主题分类，构建好用户画像；对于用户画像，使用聚类方法及知识图谱对用户进行内容推荐以及社区发现；

该方法具体包括以下步骤：

S1：数据收集：收集合适的文本及图像数据，获取用户微博的文本及图像信息；

S2：数据增强；

S3：模型训练：分别训练图像及文本分类网络；

S4：用户画像构建；使用训练好的分类网络分类得到兴趣标签，并将其加入user‑topic矩阵，得到用户画像；

S5：对于不同类的微博，采用TF‑IDF算法及词性筛选提取关键词，得到细粒度Topic‑item矩阵；

S6：采用知识图谱思想，利用知识关联，查找关键词的相似词；利用词向量构建方法将数据转成词向量表示，计算用户关键词实体的知识相关实体作为细粒度内容推荐；

S7：对于user‑topic矩阵，使用模糊聚类方法，得到不同类的社区，为微博用户进行社区发现；

S8：对用户所在社区进行社区用户相似度计算，选取相似度高的用户计算步骤S6的关键词子集，求所有相似用户的关键词子集的公共集作为步骤S6的补充推荐。

2.根据权利要求1所述的用户画像构建方法，其特征在于，步骤S1中，使用爬虫技术，爬取用户微博的内容，包括文本与图像信息。

3.根据权利要求1所述的用户画像构建方法，其特征在于，步骤S2中，所述数据增强具体包括：对图像数据进行翻转剪切，对文本数据进行同义词替换及词向量扰动。

4.根据权利要求3所述的用户画像构建方法，其特征在于，所述词向量扰动是利用对抗训练思想的知识增强方法，将文本转换成词向量，在模型训练时按照损失增加的梯度方向对词向量进行噪音干扰，与原本输入一起进行训练。

5.根据权利要求1所述的用户画像构建方法，其特征在于，步骤S3中，图像及文本分类网络均采用卷积神经网络，其中图像分类网络的卷积核使用3*3尺寸，文本分类网络的卷积核采用(2,3,4)*词向量维度的卷积核，池化层均采用max‑pooling，激活函数均使用relu函数；卷积模块后面接入全连接层，设置dropout防止过拟合，训练完成后保存模型。