用SQLSERVER2005的数据挖掘实现图书馆书目推荐服务小象

数据挖掘(DMdatamining)是从大量的,不完全的,有噪声的,模糊的,随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在的有用的信息和知识的过程。而我们的图书馆的数据库中积累了大量的读者借阅历史数据,这些数据中隐藏着大量重要信息,利用这些信息我们可以挖掘出读者对图书资源的借阅偏好模式。于是我们便利用微软SQLSERVER2005中的数据挖掘关联规则模块建立一个在线书目推荐服务系统,以提高图书馆的服务水平。

二、问题分析

指标名

含义

支持度

(Support)

支持度对项集形成有影响。

用于描述项集出现频度的指标,最低支持度(Minimum_Support)意为只对达到指定频度的项集感兴趣,如果指定最低支持度为小于1的值则微软关联规则认为你只对频度达到指定百分比的项集感兴趣。比如0.03表示项集支持度只有占到总项集数的3%才能形成项集。最大支持度(Maximum_Support)则指定了项集出现频度的上限,超过上限的项集也不是我们感兴趣的。

概率

(Probability)

概率对规则的形成有影响。

一条规则中有A的条件下会有B(A=>B)的概率是指

Probability(A=>B)=Probability(B|A)=Support(A,B)/Support(A)

指定一定的最低概率值就可以限制形成的规则数。

重要性

(Importance)

重要性对项集和规则形成均有影响。

它的定义如下:

Importance(A=>B)=log(p(B|A)/p(B|notA))

从定义知如果该值为0表示A和B没有关联性,正值表示一旦拥有A则再拥有B的概率会增长,负值表示一旦拥有A则再拥有B的概率会降低。

三、数据准备

我们收集了兰州商学院图书馆2002年到2005年的读者借阅数据,数据库具体关系如下:

“一次借阅标识”意义在于形成用户借阅的项集,举例说:甲乙(单次借阅标识分别是1和2)两人一次都借了3本书丙(单次借阅标识分别是3)一次借了两本,得到如下表所示记录:

借阅历史表

借阅流水号(主键)

单次借阅标识(外键)

书名

1

C#编程事件

2

.Net核心编程

3

.Net网络编程

4

ASP.NET高级编程

5

6

7

WindowsAPI速查手册

8

级联表约束

单次借阅标识表

单次借阅标识(主键)

如此我们便只要通过“单次借阅标识”即可区分不同用户的单次借阅。因为在每次借阅书籍时会先在单次借阅标识表中插入自增标识码,当借阅历史表增加新记录时便使用刚插入的自增标识码作为“单次借阅标识”,这样两张表便形成一对多的关系。之所以要有上面两张表,是因为SQLSERVER2005在训练关联规则模型时要有事例表和嵌套表。所谓事例表即存放鉴定一次事务的标识信息的表,用户完成他的一次借阅(当然可以不止借一本)就是一次事务,一次事务只用一个标识。我们设定单次借阅标识字段为自增字段就恰恰满足这点,所以单次借阅标识表就成了我们的事例表。嵌套表即为事例表中事务的具体细节内容表,其间用“单次借阅标识”来将各条记录形成项集。

四、开发步骤

我们用“SQLServerBusinessIntelligenceDevelopmentStudio”建立书目推荐服务程序,具体步骤如下:

一、训练模型

1.选择商业智能项目中AnalysisServices项目,建立BookHistoryAS项目

2.建立数据源,指定我们的SQLServer2005实例为数据源,并指定初始数据库为我们存放借阅历史数据的数据库。

3.建立数据源视图,将上面提及的“借阅历史”表“单次借阅标识”表都选择进来。

4.建立挖掘结构

①选择“从现有关系数据库或数据仓库”中训练和开发模型。

②选择“Microsoft关联规则”挖掘模型。

③指定“单次借阅标识”表为事例表,“借阅历史”表为嵌套表。

④按图(一)设定键列和可预测列。

之所以设定书名为可预测列是为后面的关联预测作准备。

⑤为自己设定的规则命名。

5.设置关联规则算法的参数。具体参数如图(二),各参数含义前面已做解释,在此不赘述。值得说明的是因为我们的借阅历史和书目数据量都较大,我们将最大项集计数(MAXIMUM_ITEMSET_COUNT)设置得大些400000,以免达到上限而无法生成任何有效规则。因为我校规定的单次借阅书籍上限是10本,所以将最大项集容量(MAXIMUM_ITEMSET_SIZE)设置成10,我们认为至少有两次相同的项集出现才生成规则,所以设置最小支持度(MINIMUM_SUPPORT)为2。

6.右键单击刚建立好的挖掘模型选“处理…”,开始训练模型。

7.处理完毕后打开“挖掘模型查看器”选项卡,下面会出现“项集”、“规则”、“依赖关系网络”三个子选项卡。“项集”中会列出各项集支持度,大小和各项集包含的具体项;“规则”中则显示规则的预测概率、重要性和具体内容,我们通过查看该图可以了解训练出的规则的具体形式;“依赖关系网络”则将规则用图形化的方法表示出来,非常直观,如图(三):

8.打开挖掘模型查看器,选择查看器下拉列表中的“Microsoft挖掘内容查看器”。找到NODE_DESCRIPTION字段查看第一条记录里的模型摘要信息,该信息对进一步调整参数有帮助。特别是里面的规则数(RULE_COUNT)如果偏少则对预测很不利,可以适当降低概率参数和重要度参数。调整参数后重复1-7步直到训练出满意的模型。

9.给建立的挖掘模型添加一个角色并将只读权限赋给EveryOne成员,如果不赋权则当ASP.NET程序访问数据库时会提示读取权限不足。

二、建立在线查询服务

第一个页面只是简单的数据查询而已,我们略去具体代码,看到实现效果如图(四):

点击查看后会传递该书书名到子页面,子页面实现效果如图(五):

子页面核心预测代码如下:

五、结束语

数据挖掘是数据库技术发展的结果,目前己经成功地应用于各个领域,但大部分集中在银行、金融、大型商业数据库等赢利性领域中,在高校、政府等一些非赢利性机构中应用很少,本文对关联规则的数据挖掘在高校图书馆系统中的应用进行了探索,并用SQLServerBusinessIntelligenceDevelopmentStudio和ASP.NET实现了基本功能。

THE END
1.推荐书目首页 本馆概况 电子资源 读者服务 阅读推广 学科服务 阅读推广 推荐书目 读书心得 新书通报 读书节 首页 - 推荐书目 推荐书目热门图书推荐2024年第15期“当当畅销图书推荐(二)” 2024-11-30 热门图书推荐2024年第14期当当畅销图书推荐 2024-11-19 热门图书推荐2024年第13期之“第十九届文津图书奖图书推荐(四)https://www.luibe.edu.cn/tsg1/ydtg/rmts/index.htm
2.毕业设计基于协同过滤算法的高校图书书目推荐系统个性化图书推荐展示根据协同过滤模型推荐的topN 书目列 表;新书推荐主要展示近期新增图书;借阅排行展示按照借 阅次数排序的列表;系统公告展示相关公告信息;图书搜索 模块提供 按照书名、作者、出版社等查询条件的检索查询 功能。 核心数据库表 高校图书馆书目推荐系统中的推荐模型需要利用学生 的借阅信息计算借阅持续时长、https://blog.csdn.net/qq_37340229/article/details/129568489
3.图书馆荐书活动书目推荐表根据活动期间征集到的读者推荐书目的数量和质量,我们将评选出一定数量的教师和学生作为图书馆的VIP读者,享受图书馆的VIP服务。VIP教师可在图书馆全年开馆时间内享用VIP办公区,VIP学生可以在本学期最后一个月(6月1日-6月30日)享受图书馆专用阅览座位。投稿时间截止到5月20日。本比赛最终解释权归徐特立图书馆所有。 https://www.wjx.cn/jq/37460686.aspx
4.小学班级阅读活动方案(通用13篇)2、形成学生阅读书目表,完善班级图书角的建设。以年级为单位推荐好书,要求教师向学生推荐10本好书,学生向同学推荐10本好书。形成学生阅读书目表,学校统一组织购买。班班要有图书角,图书角里的图书数量多,各班要推选好图书管理员,用好图书角。 3、形成家长阅读书目表。要求教师向家长推荐优秀育儿书籍,围绕“亲子阅读https://www.yuwenmi.com/fanwen/huodongfangan/1647039.html
5.家庭与图书馆(室)少儿推荐书目深图书单资源导航本栏目推荐书目旨在为家庭亲子共读、书香校园建设、图书馆少儿文献资源建设提供专业支持和借鉴。甄选适合0-18岁少年儿童阅读的中外经典著作,以及行业认可度高、社会影响力大的作品,融合分级阅读理念,涵盖人文社科、益智科普、文学等多个主题种类,每年更新300种,其中,幼儿读物100种,小学生读物100种,中学生读物100种。 202https://www.szlib.org.cn/bookList/BOOKBILL09.html
6.教育部印发2019中小学图书馆推荐书目附名单→买购网教育部印发2019中小学图书馆推荐书目 附名单 教育部办公厅发布关于印发《2019年全国中小学图书馆(室)推荐书目》的通知,指出中小学校要将《推荐书目》作为馆藏建设主要参考依据,严禁盗版图书等非法出版物及不适合学生阅读的出版物进入图书馆(室)。 通知称,为贯彻全国教育大会精神,落实立德树人根本任务,进一步提高中小学https://www.maigoo.com/news/533761.html
7.图书馆工作推荐书8篇(全文)图书馆工作推荐书 第1篇 2005年图书馆工作计划 一、继续做好“985”和“211”工程的建设工作 按计划完成“985”一期和“211”二期工程的建设工作,加快工程的建设速度,做好工程的验收准备。在已制定的“985”二期工程论证报告的基础上,图书馆将继续做好相关的计划,完善计划的细节问题,按计划实施各个项目。 二、加https://www.99xueshu.com/w/fileu0fnlqc9.html
8.图书书目信息(精选七篇)机读目录格式采用《中国机读目录格式》 (中华人民共和国文化部行业标准WH/T0503-96, 1996) 。主题表/分类表采用《汉语主题词表》和《中国图书馆分类法》。 (二) 充分利用现有的期刊数据库资源是书目编制的捷径。期刊机读书目的编制要求对期刊的出版发行有全面的信息资料, 自行编制书目难以保证数据的全面准确性, https://www.360wenmi.com/f/cnkeyfkwgm37.html
9.中小学图书馆室推荐书目.docx中小学图书馆室推荐书目.docx 8页VIP内容提供方:158***0159 大小:13.09 KB 字数:约3.65千字 发布时间:2024-04-26发布于江苏 浏览人气:6 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)中小学图书馆室推荐书目.docx 关闭预览 想预览更多内容,点击免费在线预览全文 免https://max.book118.com/html/2024/0424/5141330021011200.shtm
10.2023年全国中小学图书馆(室)拟推荐书目,学习出版社入选9种图书日前,教育部课程教材研究所发布《2023年全国中小学图书馆(室)拟推荐书目的公示公告》:根据《关于开展向全国中小学图书馆(室)推荐优秀图书活动的通知》及补充通知的有关要求,经过专家初次筛查、会议推荐、思想政治审查等程序,形成2023年全国中小学图书馆(室)拟推荐书目。书目以中图分类法为基础,分为五大类,4828种书http://www.xuexiph.cn/sy/gg/202401/t20240104_6722887.shtml
11.2021图书馆书目清单表免费下载Excel表格《2021图书馆书目清单表免费下载》,素材编号11828779,格式为Excel,工图网https://www.900ppt.com/excelbiaoge/c45e8541984773b611828779.html
12.图书馆书书目分类统计表图书馆书书目分类统计表学科类目种数册数占总册数百分比A马歹U毛723165B哲学士宗教632474C社科总论314580D政治法律959553E军事693246F经济560938G文教体育253666H语言文字599262I文学111384https://www.renrendoc.com/paper/167394236.html