面向智慧课堂的数据挖掘与学习分析框架及应用

关于智慧课堂的定义总体上有从教育的视角和从信息化的视角两种类型,本研究是从信息化的角度进行探讨。我们曾从信息化的视角系统梳理了当前各种智慧课堂概念或模型,在此基础上对“智慧课堂”提出了一个明确的定义[17][18]:即以建构主义学习理论为依据,利用大数据、云计算、物联网和移动互联网等新一代信息技术打造的,实现课前、课中、课后全过程应用的智能、高效的课堂。基于信息化视角的智慧课堂概念具有鲜明的技术特征:(1)教学决策数据化,即基于智慧课堂教学过程的海量行为数据进行决策分析,在课堂教学中实现了基于数据的教育;(2)学习评价即时化,智慧课堂采取伴随式数据采集与评价,贯穿于课前、课中、课后全过程,进行即时的学习诊断、评价与反馈;(3)交流互动立体化,基于“云网端”平台,实现师生之间、生生之间、教师学生与家长之间,全时空无障碍地立体化沟通、交流;(4)资源推送智能化,依据学生学习行为数据记录和分析,智能化地推送微课、作业等学习资源,满足学生个性化、多样化学习需求;(5)教学呈现可视化,利用学科思维导图、模型图、虚拟现实、增强现实等可视化技术,把本来不可见的“思维”、难以展现的复杂实验过程形象化地呈现出来。

(二)用于研究的智慧课堂平台

科学研究需要真实、具体的数据为基础。基于研究的需要,我们选取了在当前中小学使用较普遍的科大讯飞知名产品“智慧课堂”(以下除非特别说明,智慧课堂均指科大讯飞的智慧课堂产品,简称“智课”)作为研究的支撑平台。该产品以建构主义理论为依据,结合诸如“翻转课堂”“互动课堂”“混合式学习”等先进教学理念,建立“云网端”课堂信息化平台(简称“智课平台”),帮助师生课前轻松备课、预习,课上移动教学,课后个性学习、辅导。该产品已形成了理论定义、系统组成、教学模式、应用案例的完整体系[19]。

智课平台是由“云”“网”“端”构成的一体化课堂信息化平台[20]。其中云平台主要包含资源管理与服务系统、作业与动态评价系统和微课制作与应用系统等核心应用系统;微云服务器主要实现教室内构建以教室为单元的局域网信息化环境,提供本地网络、存储和计算服务;端应用工具即移动智能终端,是实现智慧课堂教学应用的基本工具。智慧课堂移动端工具基本配备包括教师端、学生端,根据需要也可配备家长端、管理端。教师端工具提供教师课堂教学的基本手段,主要包括PPT制作与投屏、微课制作与发布、互动交流和学习测评等功能,可以进行电子白板式的任意书写、记录与保存,实现任务布置、作业批改、答疑解惑、个别辅导等师生互动。学生端工具包括微课学习、课堂互动交流、作业与动态评价等主要功能,可以进行微课的学习、参与课堂师生、生生互动、完成个性化作业、查看学习成绩等。

三、智慧课堂用户模型及行为数据

(一)智慧课堂“三角用户模型”

对智慧课堂数据挖掘分析,首先要建立智慧课堂的数据模型。从信息系统的视角来分析,智慧课堂教学实际上就是教师、学生借助于信息媒介进行信息交换、传递、接受、互动的信息过程。在智慧课堂教学中,教师与学生是教学信息过程的两个主要参与者,是产生信息、处理和使用信息的主体,是课堂信息系统的活力源泉。通过对智慧课堂信息数据的梳理以及对智慧课堂产品原型的还原,我们可以抽象得到(如图1所示)智慧课堂的“三角用户模型”,用以对智慧课堂用户交互关系进行系统描述。

具体来说,智慧课堂信息系统模型构成包含两个主要参与者与一个信息对象。两个主要参与者分别是教师与学生,一个信息对象指的是由师生产生的UGC微课视频资源、各种网络互动信息、文本信息等,我们统称为泛在信息。在“三角用户模型”中,总共有五大类行为,分别是教师生成、读取泛在信息(A),学生生成、读取泛在信息(B),教师与学生间的互动(C、D),学生与学生间的互动(E)。其中教师与学生的互动C是指由教师主动发起的互动,D是指由学生主动发起的互动。这五大类行为分别对应的具体行为列表及数据中体现的发生频率如表1所示。

(二)智慧课堂互动数据分析

作业:作业传递是智课平台的基本功能,是由教师发布、学生提交为形态的一对多的公开信息。作业的频次与难度部分反映了教师的教学风格,而学生完成作业的及时性、正确率则是学生学习态度与学业能力的体现。

微课视频:是由个人(老师或学生)录制并供智慧课堂用户课前或课后观看的一种信息载体形式,它是智慧课堂教学内容建设的核心。微课视频在智慧课堂中是由老师、学生共同参与的一对多(一个微课视频只有一个作者、上传者)的公开信息。通过微课发布的频次、包含的知识点可以了解教师上课的进度与状态,借助学生对微课视频的浏览、观看、回复、点赞、收藏以及其中一些付费视频的购买行为,可以进一步衡量教师的影响力与学生对课程、教师的满意程度。学生学习微课的先后顺序则可以用来构建学生学习的知识图谱,并进一步用以比较不同学生之间的学习差异。

帖子与私信:是同一种网络文本信息的两种不同形态,帖子是一对多的公开信息,而私信则是一对一的私密信息。教师与学生,学生与学生间通过帖子、私信相互交流、互动,反映了师生、生生间的联系强弱。基于此类数据,可以构建校园的社交网络地图,进一步分析网络中影响力用户以及基于文本进行校园舆情洞察。

四、智慧课堂建模与挖掘分析体系框架

(一)“四建模三分析”框架

为了系统性地对智慧课堂中的教学行为数据进行数据挖掘与学习分析,我们参考2012年美国教育部发布的《通过教育数据挖掘与学习分析促进教与学》(ETL-EDMLA)的报告[21],结合学术界部分专家观点,针对性地提出“四建模三分析”的智慧课堂大数据研究方法论。

具体来说,“四建模三分析”主要是基于教育数据挖掘与学习分析技术在教学领域的应用提出的。建模与分析分别是围绕着学习者的内部特征与外部影响两方面展开的。在研究学习者内在行为、经历的基础上针对学习者进行画像,并在此基础上辅以知识领域的建模,全面刻画学习者内在学习特征。而在其外部,通过对学习组件以及环境进行分析,从而得出针对未来的趋势预判分析。“四建模三分析”的基本含义及着力解决的问题如下:

1.行为建模:通过对学生主动发生的学习行为进行学生建模,着重了解学生主观学习行为与学习结果关系、学生学习行为模式共性与差异、师生与生生互动联络拓扑。

2.经历建模:通过学生与教师的互动情况,着重对学生的学习感受进行建模,用以了解学生学习的主观评价以及对授课教师的侧面评价佐证。

3.画像建模:通过对包含互动对象、学习行为、学业结果数据在内的全方位的数据进行建模,对学生进行聚类分组,充分刻画学生的用户画像,以及发掘联络人网络中的有影响力节点。

4.领域建模:通过学生学习路径及其关联的知识点数据,自动对知识图谱进行建模,构建学科领域的知识图谱。

5.组件分析:通过对学习过程中的各种客观行为(组件)进行分析,获得其与学生学业结果的联系。

6.策略分析:通过对教学者教学风格等教学策略进行抽象与归纳分析,获得其对学生学业结果的影响。

7.趋势分析:借助学业结果影响因素的主观、客观、策略等因素的分析,对学业进行趋势预测;与此同时,借助网络文本数据分析对校园舆情进行管窥。

(二)“四建模三分析”的范围界定

上述七种建模与分析角度是目前教育大数据挖掘分析所公认、且成果较为密集的研究领域,并不涵盖课堂教育大数据分析的所有方向。通过“四建模三分析”方法,可以对智慧课堂的研究目标具象化,有助于在研究过程中的聚焦。本研究对智慧课堂数据建模分析研究范围界定如下:

1.对于研究目标不清晰的领域不予涉及。在学生行为建模中,业界提出对学习行为范式进行研究,这依赖于教育学、行为学等交叉学科的理论,有待于与这些领域专家的深入研究和合作,在此基础上进一步使用大数据作佐证,为共同深入该方向研究提供空间,因此本研究暂不涉及。

2.对于对象数据为传统问卷采集方式的研究未涉及。学生经历的建模在传统的教学数据采集手段中使用问卷形式进行,虽然这也是一种有效度、信度的测量方式,但由于在讯飞智慧课堂产品中未有问卷数据的体现,而且我们认为教育大数据分析能够常态化应用的前提是数据采集的常态化,因此对问卷数据采集方式在研究中不予包括。

3.对于个性化学习与自适应学习分析另有研究。个性化学习与自适应学习毋庸置疑是最为前瞻、最具特色、最有价值的课堂教学数据挖掘分析研究方向[22]。鉴于其研究重要性、方法的特殊性、以及内容丰富及相对独立等方面的考量,对个性化学习挖掘分析和自适应学习研究将作为单独领域另行开展研究。

(三)智慧课堂数据挖掘主要算法

“四建模三分析”的落地离不开数据挖掘算法与统计分析技术的应用。基于以上建模和分析的需要,根据我们的研究,智慧课堂数据挖掘使用的常用算法与技术主要包括多元回归分析、分类聚类算法、关联规则挖掘、文本分析挖掘、图构建与挖掘等方面。主要算法与技术如表2所示。

五、智慧课堂数据挖掘分析实施方法

(一)构建智慧课堂数据挖掘分析“整体棋盘”

基于“四建模三分析”总体框架以及五大类数据挖掘技术的概述,结合智慧课堂用户模型和数据体系,我们采用棋盘法将研究问题进行具象与细化,形成智慧课堂数据挖掘分析的“整体棋盘”。棋盘的首行列出七大研究方向,首列给出五大数据挖掘技术,在棋盘矩阵中纵横交错的每一个棋盘格子处则是使用某种数据挖掘方法对该类研究方向的具体细化。智慧课堂数据挖掘分析的整体棋盘如表3所示。

(二)设计研究问题及研究方法

利用教育数据挖掘和分析技术对每一项棋盘格中的研究问题进行建模分析,关键是要对具体的研究问题进行定义,设计基于行为数据的研究对象、方法和策略。根据“整体棋盘”框架,对13个具体研究问题定义如下。

六、智慧课堂数据挖掘分析应用模式

通过对5大项13个小项研究问题的具体细化,一幅针对智慧课堂数据进行应用研究的全图清晰地呈现在面前。在实践应用中,需要结合具体的专业领域应用需求和应用场景,将研究内容有机地组织起来,形成具体的应用模式。根据智慧课堂全过程、全方位的数据体系及应用需求,这里从课堂互动、学习行为、学习结果、校园社交等重点领域的分析应用入手,构建智慧课堂数据挖掘分析应用的四种基本模式。

(一)课堂互动分析应用模式

课堂互动是智慧课堂的核心特征。学生与教师互动、与资源互动、与平台互动等多向互动,很大程度上体现了学生投入学习的程度,反映了学生主动学习、积极学习的情况。基于学生和教师在智课平台的行为数据建立学生与教师互动、与平台互动的指标体系,同时依据因子分析法计算出互动指标体系的权重,进而建立教师与学生的互动指数、学生对智课平台的粘性程度指数,为设计和改进课堂教学互动提供依据。

(二)学习行为分析应用模式

(三)学习结果分析应用模式

学习结果数据是智慧课堂教学成效的基本体现。通过连续多次考试排名建立对学生成绩上升/下降、学习成绩分档模型。对学生考试成绩偏科情况探索,从整体角度分析偏科人数以及偏优和偏弱学科,从个人角度分析学生偏科行为。通过对学生历史考试成绩排名数据以及近期在作业平台上的行为数据进行未来成绩趋势预测。通过学生在智课平台的学习行为来自动还原知识图谱网络,并与人工构建知识图谱进行对比分析,描述学生的知识结构情况。

(四)校园社交分析应用模式

学生校园社交数据是反映学生全面成长、进行校园舆情管窥的重要依据。利用学生与教师、学生与学生互动的数据,分别构建校园维度和班级维度的社交网络。基于建立的班级、校园社交网络从中发现有影响力的教师和学生,在教学过程中,可利用其影响力,进行有效教学干预的最大化。从校园舆情角度来看,通过学习者在智课平台上私信、帖子等所涉及的文本内容,利用自然语言中基于情感词典的文本情感分析法,掌握学习者的情感倾向状态,以便于进行校园舆情的管窥。

七、应用实例:以学生主观行为对成绩的影响分析为例

在数据采集周期内,共选取了4次全学科考试。这四次考试分别发生在2016年1月20日、4月28日、5月30日和6月12日。经统计,四次考试全部参加的理科学生为1331人,文科学生为496人。本研究分别对理科和文科学生进行了分析,由于篇幅限制,本文中只例举理科学生的主观行为对成绩的影响分析。

(二)行为分析基本框架

(三)分析过程与结果

1.指标的筛选

初始提取出理科学生主观行为对成绩影响因素指标20个,包括根回复微课次数、非根回复微课次数、递交作业数、错题总数、评级微课次数、评级非微课次数、微课观看个数、微课观看次数、微课收藏次数、通知回复数、微课点赞次数、非微课点赞次数、社区发帖数、回复贴数、帖子中交互人数、访问别人次数、访问别人人数、与学生互批作业数、作业修订数、发给老师私信数。根据实际统计数据对这些指标进预处理,剔除统计量较小的数据,最终得到12个指标,用于下面的建模分析。

3.因子分析

利用因子分析法对多个行为指标进行降维处理[23],即用少量的综合指标来替代多个可观测变量,便于把握主要影响因素。主要包括以下步骤:

首先,要判断数据是否适合做因子分析,采用对数据进行KMO值和Bartlett球形度检验[24]。基于实际数据计算,理科学生的KMO统计量的值分别为0.697,根据评判标准可知,KMO统计量的值大于0.6,适合做因子分析;Bartlett球形度检验的卡方的P值小于0.01的显著性水平,同样显示适合做因子分析。

其次,选取基于主成分分析的提取方式对原始变量进行因子提取。运用社会学统计软件SPSS进行因子分析。通过对原始变量采取主成分分析,依据Kaiser标准(特征根大于1)来提取因子[25],可以得出特征根大于1的因子有4个。在此基础上使用正交旋转的方式计算4个因子的方差贡献率如表4所示。

从表4可以看出,这4个主因子的方差贡献率分别为:23.297%,16.873%,14.859%,8.974%。累计方差贡献率为64.003%,通过这4个主因子可以反映原有12个初始变量的64.003%信息量,因而可作为原有12个变量的主因子。其中因子1的解释率为23.297%,显著高于其他因子,是学生主观行为对成绩影响的首要因子。

第三,利用因子载荷阵进行旋转,对4个因子所反映的变量信息进行解释。由于初始提取的公共因子的涵义并不是很清晰,需要对初始的因子载荷阵进行旋转,这样可以使因子载荷矩阵结构更加简化,以方便对每个因子进行解释。按照方差最大正交旋转对初始因子载荷矩阵进行旋转,旋转之后因子载荷矩阵如表5所示。

从表5可以看出,每个主因子都包含着各自的主要变量(表中每个因子灰度显示的变量),根据各自变量的含义,对4个主因子进行维度说明。因子1主要反映了学生作业的递交、修改和错题情况,以及对老师通知的回复和私信的发送,故将因子1命名为“自主学习因子”。同理,将因子2命名为“微课观看因子”;因子3命名为“微课交流因子”;因子4命名为“非微课点赞因子”。

从因子分析的结果来看,影响理科生成绩主要的主观因子是自主学习因子、微课观看因子、微课交流因子、非微课点赞因子;其中权重最大的自主学习因子主要包含递交作业数,通知回复数,发给老师私信数,与学生互批作业数,错题总数等;自主学习因子与理科生成绩有着直接关系。

4.多元回归分析

为了拟合成绩与主观行为指标之间的具体关系并确定对成绩的显著性影响指标,这里使用理科学生2016年6月考试成绩作为因变量,并以提取的主观行为指标作为自变量进行多元回归分析。为防止变量间存在共线性现象,应利用方差膨胀因子VIF进行判断。按照统计经验:当0<><><>

通过首轮计算可以看出,微课观看个数和微课观看次数之间存在较强的多重共线性。删除微课观看个数,再进行多元回归分析输出结果如表6所示。

从输出的VIF值可以看出,删除微课观看个数之后,指标之间不存在多重共线性。

(四)结论

对于理科来说,从回归分析的输出结果可以看出,在0.05的显著性水平下,根回复微课次数、递交作业数、与学生互批作业数这3个变量对成绩的影响是显著的。根回复微课次数、与学生互批作业数的系数分别为-3.375、-3.658,对成绩产生负的影响;递交作业数的系数为0.326,对成绩产生正的影响。影响理科学生成绩的主要指标是根回复微课次数、递交作业数、与学生互批作业数。

参考文献:

[1]杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016,(1):50-61.

[2]金陵.大数据与信息化教学变革[J].中国电化教育,2013,(10):8-13.

[3][21]BienkowskiM,FengM,MeansB.Enhancingteachingandlearningthrougheducationaldataminingandlearninganalytics:Anissuebrief[J].USDepartmentofEducation,OfficeofEducationalTechnology,2012,(1):1-57.

[5]娄晓敏.我国教育大数据建设的现状分析与架构初设[J].中国电化教育,2017,(8):128-131.

[6]葛道凯,张少刚,魏顺平.教育数据挖掘方法与应用[M].北京:教育科学出版社,2012.12.

[7]杨永林,张世蓉等.从“慕课”到“小微课”,看大数据在教学中的应用[J].现代教育技术,2014,24(12):45-51.

[8]李曼丽,黄振中.MOOCs平台大数据的教育实证[J].科学通报,2015,(5):570-580.

[9]周丹,陈丽婷.大数据时代背景下基于翻转课堂的教学改革研究[J].教育与职业,2015,(33):90-92.

[10]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析与预测[J].计算机研究与发展,2015,52(3):614-628.

[11]贺超凯,吴蒙.edX平台教育大数据的学习行为分析与预测[J].中国远程教育,2016,(6):54-59.

[12]刘军.智慧课堂:“互联网+”时代未来学校课堂发展新路向[J].中国电化教育,2017,(7):14-19.

[13]刘邦奇.智慧课堂:“互联网+”时代的课堂变革[N].江苏教育报,2016-09-21(04).

[14]王盛之,毛沛勇.基于数字化教学案的智慧课堂互动教学系统实践研究[J].教学月刊(教学管理)中学版,2014,(4):51-55.

[15]林利尧.中小学智慧课堂建设与应用研究[J].中国现代教育装备,2013,(10):38-39.

[16]邓光强.“智慧课堂”中的学生个性化学习[J].教育信息技术,2013,(12):11-13.

[17]孙曙辉,刘邦奇.基于动态学习数据分析的智慧课堂模式[J].中国教育信息化,2015,(22):21-24.

[18]刘邦奇.“互联网+”时代智慧课堂教学设计与实施策略研究[J].中国电化教育,2016,(10):51-56.

[20]孙曙辉,刘邦奇.智慧课堂[M].北京:北京师范大学出版社,2016.

[22]马相春,钟绍春,徐妲.大数据视角下个性化自适应学习系统支撑模型及实现机制研究[J].中国电化教育,2017,(4):97-102.

[23]刘亚瑜.中小学教师教学专业化评价指标体系的构建[D].西安:陕西师范大学,2008.

[24]辛督强,韩国秀.因子分析法在科技期刊综合评价中的应用[J].数理统计与管理,2014,33(1):116-121.

[25]任雪松,于秀林.多元统计分析.第2版[M].北京:中国统计出版社,2011.

[26]田水承,薛明月等.基于因子分析法的矿工不安全行为影响因素权重确定[J].矿业安全与环保,2013,(5):113-116.

THE END
1.数据挖掘的主要技术和应用数据挖掘(Data Mining)是一种利用统计学、机器学习、数据库、算法等方法从大量数据中发现隐藏的模式、规律和知识的科学。数据挖掘技术广泛应用于商业、金融、医疗、科学等领域,为决策提供有价值的信息和洞察,提高了企业的竞争力和效率。 在本文中,我们将从以下几个方面进行阐述: https://blog.csdn.net/universsky2015/article/details/137300243
2.数据挖掘与应用(豆瓣)《数据挖掘与应用》全面地介绍了数据挖掘的相关主题.包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用:同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。 https://book.douban.com/subject/3812646/
3.简述数据挖掘的主要应用领域。简述数据挖掘的主要应用领域。相关知识点: 试题来源: 解析 数据挖掘的主要应用领域包括:① 金融行业:信用卡欺诈检测、信用评分等;② 零售行业:商品推荐、库存管理、客户细分等;③ 医疗行业:疾病预测、药物研发、医疗诊断等;④ 互联网行业:搜索引擎优化、广告投放、用户行为分析等。https://easylearn.baidu.com/edu-page/tiangong/questiondetail?id=1815584723580159382&fr=search
4.如何进行数据挖掘(数据挖掘方法与应用)数据挖掘是从大量数据中通过算法和统计模型提取模式与知识的过程,它广泛应用于商业智能、金融分析、市场分析、医疗诊断等领域,以下是进行数据挖掘的步骤和方法: (图片来源网络,侵删) 1. 确定问题和目标 在任何数据挖掘项目开始之前,必须明确你希望通过数据挖掘解决的问题以及你的目标是什么,这将指导后续的数据收集和分https://www.kdun.com/ask/490583.html
5.数据挖掘:原理与应用——丁兆云,周鋆,杜振国目前,数据挖掘类课程已成为我国新工科教育的数据科学思维提升课程,成为信息、电子等各类工科专业本科生与研究生的必修课。本书深入浅出地介绍了数据挖掘和数据分析的知识、常用的各类算法;系统梳理与比较各类算法的优缺点与适用场景。本书内容结合作者多年的科研和教学经验,大量案例来自作者的项目和科研成果,不仅适合作为http://m.cmpedu.com/books/book/5605161.htm
6.清华大学出版社图书详情本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、http://www.tup.tsinghua.edu.cn/booksCenter/book_09444801.html
7.《数据挖掘技术与应用》(陈燕屈莉莉)简介书评数据挖掘技术与应用 作者:陈燕屈莉莉出版社:大连海事大学出版社出版时间:2020年08月 手机专享价 ¥ 当当价降价通知 ¥26.30 定价 ¥31.00 配送至 北京市东城区 运费6元,满49元包邮 服务 由“当当”发货,并提供售后服务。 当当自营 商品详情 开本:16开http://product.dangdang.com/29127315.html
8.数据挖掘的应用与分析比如说,数据挖掘应用到电信反欺诈行业,使得欺诈行为无处藏身,人们的日常生活消费将会变得更加“安全”。但是,数据挖掘在很多方面还有很大的发展潜力:数据挖掘理论与算法,这是一个无止境的研究过程,同时,挖掘各种类型复杂的数据也是一项繁重而且复杂的工程,这都给数据挖掘工程师带来了很大的挑战。本文在已有的数据挖掘的https://cdmd.cnki.com.cn/Article/CDMD-10530-1017263901.htm
9.数据挖掘:原理与应用首页 馆藏纸本 图书详情 数据挖掘 :原理与应用 出版社:机械工业出版社 ISBN:9787111696308 出版年:2021 作者:丁兆云,周鋆,杜振国著 资源类型:图书 细分类型:中文文献 收藏单位馆藏地在架状态索书号 宁波材料技术与工程所阅微楼二层西侧202在架上TP311.131/1 https://www.las.ac.cn/front/book/detail?id=f981ae4bea8ec7916300c4f700e294c8
10.什么是数据挖掘数据挖掘有哪些应用数据挖掘是一种从大量数据中自动发现隐藏信息和潜在关系的技术。它运用了统计学、机器学习和数据库等相关领域的知识与技术,可以帮助人们对数据进行全面深入的分析,提高数据的利用价值。https://www.eefocus.com/e/1348975.html
11.大数据智能计算与数据挖掘技术大数据挖掘算法与应用10.举例说明你身边的数据挖掘应用实例 1.数据挖掘的定义 学术界对数据挖掘的定义为:通过相关算法从大量的数据中搜索隐藏于其中信息的过程,是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则https://blog.51cto.com/u_14230/7943483
12.数据挖掘的应用嘲有哪些在医学分析的领域,病人的病例可以通过记录他的门诊就诊次数和假期的季节来分析。它还有助于确定对各种疾病,成功进行药物治疗的模式。研究人员也正在使用多维数据来降低成本,提高提供的服务质量,并提供更广泛和更好的护理。 5、教育 在教育领域,数据挖掘的应用一直很普遍,其中新兴的教育数据挖掘应用,主要集中在从教育机https://www.linkflowtech.com/news/2012
13.数据挖掘算法与应用(Python实现)孙家泽,王曙燕编理科教材1.7数据挖掘应用27 1.7.1数据挖掘在市场营销中的应用27 1.7.2数据挖掘在电信行业的应用28 1.7.3数据挖掘在银行业的应用29 1.7.4数据挖掘在社交网络分析中的应用29 1.7.5数据挖掘在软件工程中的应用30 1.8数据挖掘中的隐私权保护33 1.8.1侵犯隐私权的表现34 1.8.2保护隐私权的对策35 1.9数据挖掘https://item.winxuan.com/1202167992
14.《数据挖掘与数据化运营实战》——数据在运营中的应用数据越来越庞大并且也越来越重要的今天,如何充分利用现有的数据产生更多的数据并且把海量数据转化为实用价值为企业带来真实利益,是众多互联网公司尤其是初创的互联网都要深入思考的问题,幸而经过互联网这些年的长足发展,在数据领域这一块,结合传统的思路和方法,已经有比较成熟的互联网数据挖掘技术,并且应用于运营方面也https://www.jianshu.com/p/d858a19ce463
15.科学网—Python数据挖掘与机器学习实践技术应用Python 数据挖掘与机器学习实践技术应用 本内容将通过实际案例的形式,介绍如何提炼创新点,以及如何发表高水平论文等相关经验。旨在帮助学员掌握Python编程的基础知识与技巧、特征工程(数据清洗、变量降维、特征选择、群优化算法)、回归拟合(线性回归、BP神经网络、极限学习机)、分类识别(KNN、贝叶斯分类、支持向量机、决策https://blog.sciencenet.cn/blog-3548666-1390747.html
16.数据挖掘都包括什么帆软数字化转型知识库数据挖掘是一门从大量数据中提取有用信息和知识的技术和过程,主要包括数据预处理、数据清洗、数据转换、数据挖掘算法、模式评估、结果解释与展示等步骤。数据预处理是其中一个关键环节,它包括数据的收集、整理和初步筛选。通过数据预处理,能够有效提高数据的质量和一致性,为后续的数据分析奠定坚实基础。数据预处理主要包括https://www.fanruan.com/blog/article/592401/
17.数据挖掘工作总结(通用8篇)从这个方面切入数据挖掘领域的话你需要学习《数理统计》、《概率论》、《统计学习基础:数据挖掘、推理与预测》、《金融数据挖掘》,《业务建模与数据挖掘》、《数据挖掘实践 》等,当然也少不了你使用的工具的对应说明书了,如SPSS、SAS等厂商的《SAS数据挖掘与分析》、《数据挖掘Clementine应用实务》、《EXCEL 2007数据https://www.360wenmi.com/f/file17l2qeo4.html
18.数据挖掘技术在电子商务中的应用研究论文[摘要]电子商务在现代商务活动中的正变得日趋重要,而商务数据的处理则凸显出数据挖掘的重要。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。 [关键词]数据挖掘 电子商务 数据库 一、概述 数据挖掘(data mining)起源于数据库中的知识发现(knowledge discover in database,kdd),是指https://www.yjbys.com/biyelunwen/fanwen/dianzishangwu/690048.html
19.《数据挖掘应用》课件.ppt《数据挖掘应用》PPT课件欢迎来到《数据挖掘应用》PPT课件!本课程将介绍数据挖掘的概念、任务、流程、算法以及应用实例,并展望其发展趋势和应用前景。让我们一起深入探索数据挖掘的奥秘。一、介绍数据挖掘的定义数据挖掘是指从大量数据中发现隐藏在其中有价值的信息和模式的过程。了解数据挖掘的基本概念、优势和局限性。https://max.book118.com/html/2023/1224/5002131114011031.shtm
20.《数据挖掘与机器学习:WEKA应用技术与实践》(袁梅宇)电子书下载《数据挖掘与机器学习:WEKA应用技术与实践》(袁梅宇)内容简介: 《数据挖掘与机器学习:WEKA应用技术与实践》借助代表当今数据挖掘和机器学习高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全..https://e.jd.com/30286102.html