利索能及
我要发布
收藏
专利号: 202010207828X
申请人: 卓尔智联(武汉)研究院有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-05-11
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种图书信息推荐方法,其特征在于,包括:

获取过往所选图书信息;

调用预先建立的关联规则数据库,所述关联规则数据库的建立过程包括:获取图书信息与用户数据;采用改进关联分析数据挖掘算法对所述图书信息与所述用户数据进行数据挖掘,挖掘支持度大于最小支持度阈值以及置信度大于最小置信度阈值的强关联规则,形成关联规则数据库;

将所述过往所选图书信息与所述关联规则数据库进行关联匹配,按照匹配度生成推荐图书信息。

2.如权利要求1所述的图书信息推荐方法,其特征在于,所述采用改进关联分析数据挖掘算法对所述图书信息与所述用户数据进行数据挖掘,形成关联规则数据库包括:将扫描数据库后的数据赋值给初始化后的矩阵D,从而获得布尔矩阵D1,所述布尔矩阵D1的行与列分别代表项I与事务T,在所述布尔矩阵D1的最后增加1列,该列对应的数值为每行中“1”的个数;当事务T1内含有“1”时,则T11=1,否则T11=0;将每行数据相加,确定最小支持度阈值;计算各项的支持度,如果某项的支持度小于所述最小支持度阈值,则删除该项所对应的矩阵列,从而获得频繁项集L;将频繁项集L自连接获取集合C,计算矩阵各行“1”的出现次数,进行“与”运算,求和后获得频繁项集L’,最终生成强关联规则数据库。

3.如权利要求2所述的图书信息推荐方法,其特征在于,在所述采用改进关联分析数据挖掘算法对所述图书信息与所述用户数据进行数据挖掘之前还包括:对所述图书信息与所述用户数据进行数据清洗、和/或数据转换、和/或数据集成操作。

4.如权利要求3所述的图书信息推荐方法,其特征在于,所述获取图书信息与用户数据包括:通过python的分布式爬取框架从目标网站上爬取所述图书信息与用户数据。

5.如权利要求1至4任一项所述的图书信息推荐方法,其特征在于,所述将所述过往所选图书信息与所述关联规则数据库进行关联匹配,按照匹配度生成推荐图书信息包括:将所述过往所选图书信息与所述关联规则数据库进行关联匹配,按照匹配度的高低排序生成推荐图书目录。

6.如权利要求5所述的图书信息推荐方法,其特征在于,所述图书信息包括以下任意一种或任意组合:用户评论信息、阅读时间信息、图书的标签信息、作者信息、出版社信息、数值化的评分信息、文字评价信息。

7.一种图书信息推荐装置,其特征在于,包括:

获取模块,用于获取过往所选图书信息;

调用模块,用于调用预先建立的关联规则数据库,所述关联规则数据库的建立过程包括:获取图书信息与用户数据;采用改进关联分析数据挖掘算法对所述图书信息与所述用户数据进行数据挖掘,挖掘支持度大于最小支持度阈值以及置信度大于最小置信度阈值的强关联规则,形成关联规则数据库;

推荐模块,用于将所述过往所选图书信息与所述关联规则数据库进行关联匹配,按照匹配度生成推荐图书信息。

8.如权利要求7所述的图书信息推荐装置,其特征在于,还包括:

数据预处理模块,用于在所述采用改进关联分析数据挖掘算法对所述图书信息与所述用户数据进行数据挖掘之前,对所述图书信息与所述用户数据进行数据清洗、和/或数据转换、和/或数据集成操作。

9.一种图书信息推荐系统,其特征在于,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述图书信息推荐方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述图书信息推荐方法的步骤。