利索能及
我要发布
收藏
专利号: 2019108074951
申请人: 西安工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-18
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种根据图书馆读者借阅行为进行图书推荐的方法,其特征在于,包括以下步骤:步骤1、通过前期专家主导的访问系统,结合图书管理权限及采访获取读者借阅集合,作为挖掘样本;

步骤2、对挖掘样本的数据进行预处理;

步骤3、依据图书类型进行聚类,找出读者间的阅读共性,利用k-Means算法,以图书借阅情况为参数划分为四个群组,每个群组表示一种阅读模式;

步骤4、利用GRNN算法建立模型并进行训练,输入读者借阅图书信息,输出聚类的四个群组,对于输出的四个聚类群组分别推荐各自包含的图书。

2.如权利要求1所述的一种根据图书馆读者借阅行为进行图书推荐的方法,其特征在于,所述步骤1以图书馆的读者借阅数据为对象,使用MS SQL Server2008为数据的基础框架,配合Excel工具对数据进行前期预处理,得到与读者借阅集合相关的1000条事务数据,作为挖掘样本。

3.如权利要求2所述的一种根据图书馆读者借阅行为进行图书推荐的方法,其特征在于,所述步骤2具体包括以下步骤:步骤2.1:首先对挖掘样本的数据进行清洗:发现并纠正数据文件中可识别的错误,检查数据一致性,处理无效值和缺失值;

步骤2.2:再对清洗后的数据进行转换:将读者借阅的图书按《中图法》的22个大类进行划分,通过读者对某类图书的借阅预测出相关的图书类型;

步骤2.3:最后对转换后的数据进行集成:将读者借阅图书的历史集合成符合数据挖掘所需的事务数据,每个事务代表读者的一个借阅行为,包含一个唯一的标识和读者借阅各类图书的集合。

4.如权利要求3所述的一种根据图书馆读者借阅行为进行图书推荐的方法,其特征在于,所述步骤3具体包括以下步骤:步骤3.1:依据书籍类型进行聚类,随机寻找四个数据点,作为各个类的初始“质心”,且表示最终分成的四类群组;

步骤3.2:根据“距离中心最近”的原则,寻找与各个对象最为相似的类,将其他对象划分为到各个相应的类中;

步骤3.3:在完成对象的分配之后,针对每一个类,求出所有对象的平均值,作为本群组的新“质心”;

步骤3.4:根据“距离中心最近”的原则,重新进行所有对象的划分;

步骤3.5:返回步骤3.3,直至所有产生的类没有变化为止。

5.如权利要求4所述的一种根据图书馆读者借阅行为进行图书推荐的方法,其特征在于,所述步骤4的GRNN模型训练步骤具体包括:步骤4.1:将1000组样本分成20份数量相同的样本,选取19份进行训练,建立GRNN模型,剩下一份,即50组样本,作为测试样本进行验证,并计算测试结果和真实值的误差均方值;

步骤4.2:设置光滑因子σ取值区间为[0.01,1],变化步长0.01,逐渐增加;

步骤4.3:重新调整训练样本和测试样本,重复步骤4.1和4.2,如此循环20次,得到各光滑因子对应的20组误差均方值,并求取20组误差均方值的平均值。