基于hadoop的高校图书馆阅读书目智慧推荐系统的设计与实现
1.选题背景及意义:
个性化推荐技术是根据用户的历史行为数据以及习惯数据,主动分析用户的兴趣喜好,并为用户推荐符合其兴趣爱好的物品。现在随着数据量的急剧增加,互联网数据的级别已经达到TB、PB、EB、ZB的级别,基于大数据的推荐已经应用而生。个性化推荐技术正是借助于机器学习以及数据挖掘算法才能够成功应用到各种各样的电子商务平台。但是在高校图书馆中图书资源这个领域进行个性化推荐还不够普及和完善。早期国内外有一些学者开始做图书方面的个性化推荐,但是这些推荐都或多或少的存在一些问题,推荐不够准确,准确率和召回率低,此外对大数据推荐没有做一些技术处理,图书推荐算法没有改进,导致这些推荐系统没有实现针对高校学生的真正意义上的个性化推荐。随着高校图书馆资源越来越丰富,图书馆里面的图书资源的种类和数量也是越来越多,图书数据量呈指数爆炸式增长,在海量的图书数据中如何挖掘出每个用户的兴趣和爱好,然后对用户实现个性化推荐正是科研领域内的研究者们在做的研究工作。同时也是由于这种需求的存在,推荐技术被迅速运用到高校图书推荐领域。
2.国内外背景分析:
研究内容、研究方法与思路:
从两个方面进行描述:
1.研究内容:
拟实现的内容模块:图书管理模块、用户管理模块、用户浏览及阅读信息挖掘模块、智能推荐模块、读者反馈模块、借阅管理模块。本文研究的主要内容是通过基于Hadoop大数据处理框架实现图书的个性化推荐功能。图书馆内的图书资源众多,用户在进行选择时难免眼花缭乱,大数据推荐技术正好可以实现对用户的个性化推荐,方便用户快速找到自己需要的图书资源。
2.研究方法与思路:
对推荐算法的研究,通过比较分析了解国内外推荐系统的研究状况。主要是研究一些经典的推荐算法包括协同过滤推荐算法、基于用户的推荐、基于项目的推荐等,推荐算法在实际生活的各个领域中应用很广泛,具有很大的应用价值,本文主要讨论的是基于用户的协同过滤推荐算法在个性化推荐系统中的应用。
主要创新点:
(1)对Hadoop的整体框架以及其核心技术——HDFS和MapReduce作了详细
介绍与分析。
(2)对推荐系统的发展进行了介绍,重点研究了推荐算法,对常用的几类推荐算法及其性能评价做了较为详细的介绍。
(3)对本文所要实现的个性化推荐系统进行了设计,并按不同系统模块依次进行了细节描述,在Hadoop平台上构建起了一个个性化推荐系统
总体安排和计划进度:
2022年09月22日至2022年10月13日:根据任务书要求,做好开题准备工作,完成开题报告;
2022年10月14日至2023年03月06日:完成课题主要任务并提交论文初稿;
2023年04月06日至2023年04月27日:答辩。
准备情况:
1.文献参考:
[1]杨凯.基于Hadoop平台的个性化新闻推荐系统的设计与实现[D].北京交通大学,2019.
[2]杨宏胜.基于大数据的用户个性化推荐系统设计与实现[D].南京邮电大学,2020.
[3]刘畅.基于Hadoop的影片推荐系统的研究与开发[D].华北电力大学,2021.
[4]叶熠琳.基于Hadoop的个性化推荐系统的设计与实现[D].天津大学,2017.
[5]王茜子.基于混合算法的电影推荐系统的研究与设计[D].电子科技大学,2020.
[6]严亚宁.基于Hadoop的数据处理平台的设计与开发研究[J].现代信息科技,2019,3(03):5-7.
[7]刘媛媛.基于Mahout的电子商务个性化推荐系统的设计与实现[D].中国科学院大学(中国科学院工程管理与信息技术学院),2017.
[8]杨议.基于SSH架构的高校自助化图书管理系统的设计与实现[D].大连理工大学,2015.
2.实验仪器设备准备情况:
系统的实现采用的是基于SSH框架模式进行开发Web推荐引擎的。系统的开发前端框架使用的是Jquery+EasyUI进行搭建的。后端的开发环境是采用的是经典的SSH框架。