互联网教育智能技术及应用国家工程研究中心

摘要:近五年网络教育的变革和深度学习等人工智能技术的飞速发展给学习者模型的研究和应用带来了新的机遇和挑战。目前,教学数据中蕴含的大量价值亟待挖掘,而实践中绝大部分教学环境对学习者的理解、状态跟踪和自适应性仍处于初级阶段。如何从数据中建立学习者模型、如何在教学环境中设计和使用学习者模型是下一阶段教育变革的核心技术问题。为此,本文从知识状态模型、认知行为模型、情感模型和综合模型四个类别分别阐述了具有代表性的学习者模型及其主要应用场景。研究认为,深度学习未来将在学习者模型的研究和实践中扮演重要角色,而基于各种学习者数据对学生进行全面而综合性建模的综合模型应用是大势所趋。

关键词:在线教育;在线学习;学习者模型;学习分析;教育数据挖掘

一、引言

当前,我国的教育信息化发展进入到以有效支持教与学、促进学生个性化发展为核心诉求的新阶段。《教育信息化十年发展规划(2011-2020年)》在基础教育信息化发展水平框架中提出,学校教育教学方式的变革要在学生多样性、个性化学习的改变上取得突破。《国家中长期教育改革和发展规划纲要(2010-2020年)》也指出,“关心每个学习者,促使学生更加主动积极地发展,尊重教育规划和学生身心发展规律,为每个学生提供适合的教育”。在这一进程中,对学习者模型的研究尤为重要。

学习者模型是对真实学习者的一种抽象表示,代表了学习者的知识技能、认知行为、情感体验等方面的水平和特征(Chrysafiadi&Virvou,2013)。在智能辅导系统中,学习者模型扮演着大脑的角色,它可以在学习者学习的过程中跟踪其状态的变化,并自适应地给学习者提供合适的交互。而在大规模在线学习环境中,学习者模型可以对大规模的学习者进行定性或定量描述,为教师和学习环境设计人员的决策提供重要参考。在大数据和人工智能的时代,学习者模型有着非常广阔的研究空间和应用场景。

二、以知识状态为基准的学习者模型

表1贝叶斯知识跟踪(BKT)的四个参数

基本BKT模型中的四个参数分别是针对各个技能点和题目设置的,并没有考虑学生个体在能力上的差异。针对该局限性,Wang和Heffernan(2012)、Pardos和Heffernan(2010)分别对BKT模型提出了多种扩展,通过增加隐式节点使模型能够模拟学习者在个体能力上的差异。Yudelson、Koedinger和Gordon(2013)通过比较各种个性化扩展的方式,发现在习得概率p(T)上的个性化对模型的预测效果有较大的作用;相比之下,针对p(L0)的个性化对模型的预测效果的提升较小。

三、以认知行为为基准的学习者模型

学习者知识状态模型一般仅仅基于学习者的测评数据进行建模,但实际上学习者在教学环境中留下的数字足迹远不止测评数据,这一点在学习管理系统(LMS)和大规模在线学习环境下尤为明显。彭文辉等(2006)从信息检索学习行为、信息加工学习行为、信息发布学习行为、人际沟通交流行为、基于问题解决的学习行为五个维度构建了多维度的网络学习行为模型。Veeramachaneni等(2013)则将MOOCs下学习者的行为分为观察、提交、协作三类。观察类行为指的是学习者浏览和观察网站上的资源,如维基、论坛、授课视频和电子书等的行为;提交类行为指的是学习者提交自己生成的内容和反馈,如作业、考试、测验、练习、笔记、实验等;在协作类下,学习者与其他学习者产生交互,如论坛模块内的讨论、维基模块内的协同编辑等。尽管学习者认知行为模型的研究和应用并不仅仅受限于MOOCs这一个学习环境,但MOOCs由于其较大的学生规模、多样并开放的交互方式,无疑为学习者认知行为模型的研究提供了非常好的土壤。

依据学习者的行为数据,我们可以选取合适的特征对学习者进行分组。例如,Anderson等(2014)根据观看视频和提交作业的情况,将学习者按照投入模式分为观察型、解题型、全面型、收集型和局外型五个类别。观察型主要观看视频,很少提交作业;解题型与其相反,主要行为是提交作业,而观看视频行为则很少;全面型综合了观察型和解题型,既观看视频也提交作业;收集型也很少提交作业,但他们主要是下载视频,至于有没有观看则无从知晓;局外型则是注册了课程但整体行为量低于一定阈值的不活跃用户。宗阳等(2016)基于学习平台上记录的行为数据和RFM模型将学习者分为八个学习者价值类型,每个类型都具有不同的行为特征。

和深度知识跟踪模型(DKT)类似,Tang等(2016)也提出了面向学习者行为的深度模型。该深度行为模型可以根据学习者的历史行为来预测学习者下一步的行为,实验显示和传统模型相比,深度模型在预测准确率上有一定的优势。该深度模型和深度知识跟踪模型(DKT)一样采用循环神经网络来表示学习者,但该行为模型考虑了学习者所有类别的行为数据,而不仅仅是DKT所考虑的评测数据。此类模型的应用场景可能包括自动化推荐系统:系统可以根据学习者的历史行为来预测其下一步行为,评估该行为是否会达到理想的学习结果,并进一步选择是否干预以及合适的推荐内容。

四、以情感为基准的学习者模型

在采集多模态的数据之后,情感建模往往需借助机器学习领域的模型和技术来处理多模态数据的复杂性和情感识别过程中的不确定性。例如,Kapoor、Burleson和Picard(2007)采用特征提取和情感分类两个模块从多模态数据中构建情感建模。而Conati(2002)则基于人脸、皮肤电传导、心跳等数据,采用动态贝耶斯网络来监控学习者情感。总的来说,有两种多模态数据的融合策略:一种是特征层融合,基于不同模态构建特征向量,用于分类器的输入;另一种是决策层融合,每个模态都有自己单独的分类器,而这些分类器的结果将组合在一起用作一个最终分类器的输入。尽管特征层融合有可能获得更好的识别效果(Caridakisetal.,2008),但是决策层融合无疑具有更加模块化的优势(Pantic,2005)。采用决策层融合的策略,开发者可以直接调用第三方提供的情感识别API,从而大大简化了情感模型的构建。

目前,在学习者情感模型中常用的特征有人脸图像或视频、语音和文本等(Ez-Zaouia,Lavou,&Elise,2017)。可以预见,随着普适计算、穿戴式设备、情感计算和人工智能等领域的发展,学习者情感模型将更加多模化与智能化,其应用场景也更为广阔。

五、学习者综合模型

学习者综合模型指的是对学习者多个方面进行综合而建立的整体性模型。例如,在自适应学习系统中可以通过对学习者的知识水平、认知能力、偏好信息进行综合性建模,提高自适应学习系统适应学习者的能力(贾冰,2010)。除了在自适应学习系统中的应用外,学习者综合模型还有两类比较典型的应用场景。一类是预测性模型,这类模型为了提高预测准确率而综合考虑了学习者的多种信息;另一类是评价性模型,这类模型为了提高评价的客观性和全面性,也尽可能多地考虑学习者的多种信息。

预测性学习者综合模型的一个典型应用场景是MOOCs环境下的退学预测(Nagrecha,Dillon,&Chawla,2017)。因为高退学率是MOOCs最显著的一个缺点,所以退学预测一直是MOOCs研究的一个重要主题。退学预测的大多数研究采用的是监督式分类的方法,系统可以采用点击流、作业评分、社会网络甚至人口学信息等多种数据源,通过特征工程和机器学习算法来优化预测准确率。这类学习者综合模型虽然综合了学习者在多个方面的信息,但模型的可解释性存在一定的挑战。目前主要有两种方法可以保留预测性模型的可解释性:第一种方法是需要采用线性模型、决策树等可解释的分类技术,这种方式可能要损失一定的预测表现;第二种方法是使用Parzen(Baehrensetal.,2009)或LIME(Ribeiro,Singh,&Guestrin,2016)等模型解释技术。

评价性学习者综合模型的提出则主要为学生评价服务,需要以教学目标作为价值判断的依据和准绳。例如,郑勤华等(2016)以学生综合评价为目标,通过理论演绎和专家访谈构建了以投入度、完成度、调控度、联通度和主动性为核心的五维度综合评价参考理论模型,并通过学习行为数据聚合特征变量,构建了相应的计算模型,如图1所示。其中,投入度从活跃性、持续性等方面对学生在线学习的投入程度进行评价;完成度以课程的教学目标为标准对学生实际完成情况进行评价,对于不同类型的课程教学目标的侧重点不同,完成度的指标以及权重设置也会进行相应调整;主动性包括完成自主学习任务的主动性、参与教师指定教学活动的主动性以及进行交互的主动性等,主动性在一定程度上表征了学习者的学习动机水平与变化情况;调控度从学习的规律性、持续性、效率等方面对学生调控自己学习过程的水平进行评价,是对学生认知策略、自主学习能力进行表征和评价的重要维度;联通度则对学生建立社会化认知网络的能力进行评价,包括建立连接的能力、维护连接的能力等。联通度的评价核心是交互,包括学生与资源的交互、学生与教师及其他学习同伴的交互。

图1学生综合评价参考模型

六、讨论和建议

[参考文献]

[1]黄焕.2014.面向e-Learning的学习者情感建模及应用研究[D].武汉:华中师范大学国家数字化学习工程技术研究中心.

[2]贾冰.2010.自适应学习系统中学习者模型的表示及特征值获取方法研究[D].长春:东北师范大学教育部数字化学习支撑技术工程研究中心.

[3]彭文辉,杨宗凯,黄克斌.2006.网络学习行为分析及其模型研究[J].中国电化教育(10):31-35.

[4]疏凤芳,赵呈领,万力勇,等.2012.基于qq群的网络课堂交互特性研究.现代教育技术,22(7):83-88.

[5]张舸,周东岱,葛情情.2012.自适应学习系统中学习者特征模型及建模方法述评[J].现代教育技术,22(5):77-82.

[6]郑勤华,陈耀华,孙洪涛,等.2016.基于学习分析的在线学习测评建模与应用——学习者综合评价参考模型研究[J].电化教育研究(9):33-40.

[7]宗阳,郑勤华,陈丽.2016.中国moocs学习者价值研究——基于RFM模型的在线学习行为分析[J].现代远距离教育(2):21-28.

[8]Afzal,S.&Robinson,P.(2010).Modellingaffectinlearningenvironments-motivationandmethods.IEEEinternationalconferenceonadvancedlearningtechnologies,438-442.

[9]Anderson,A.,Huttenlocher,D.,Kleinberg,J.,&Leskovec,J.(2014).Engagingwithmassiveonlinecourses,InternationalconferenceonWorldWideWeb,687-698.

[10]Baehrens,D.,Schroeter,T.,Harmeling,S.,Kawanabe,M.,Hansen,K.,&Müller,K.R.(2009).Howtoexplainindividualclassificationdecisions.JournalofMachineLearningResearch,11(9),1803-1831.

[11]Caridakis,G.,Castellano,G.,Kessous,L.,Raouzaiou,A.,Malatesta,L.,Asteriadis,S.,&Karpouzis,K.(2008).Multimodalemotionrecognitionfromexpressivefaces,bodygesturesandspeech.InternationalFederationforInformationProcessing,247,375-388.

[12]Chrysafiadi,K.&Virvou,M.(2013).Studentmodelingapproaches:aliteraturereviewforthelastdecade.ExpertSystemswithApplications,40(11),4715-4729.

[13]Conati,C.(2002).Probabilisticassessmentofuser’semotionsineducationalgames.AppliedArtificialIntelligence,16(7-8),555-575.

[14]Corbett,A.T.&Anderson,J.R.(1994).Knowledgetracing:modelingtheacquisitionofproceduralknowledge.UserModelingandUser-AdaptedInteraction,4(4),253-278.

[15]Craig,S.,Graesser,A.,Sullins,J.,&Gholson,B.(2004).Affectandlearning:anexploratorylookintotheroleofaffectinlearningwithAuto-Tutor.JournalofEducationalMedia,29(3),241-250.

[16]Desmarais,M.C.(2012).Mappingquestionitemstoskillswithnon-negativematrixfactorization.ACMKDD-Explorations,13(2),30-36.

[17]Doddannara,L.S.,Gowda,S.M.,Baker,R.S.J.D.,Gowda,S.M.,&Carvalho,A.M.J.B.D.(2013).ExploringtheRelationshipsbetweenDesign,Students’AffectiveStates,andDisengagedBehaviorswithinanITS.ArtificialIntelligenceinEducation.SpringerBerlinHeidelberg,31-40.

[18]Dowell,N.M.,Skrypnyk,O.,Joksimovic,S.,Graesser,A.C.,Dawson,S.,Gaevic,D.,Kovanovic,V.(2015).Modelinglearners’socialcentralityandperformancethroughlanguageanddiscourse.InternationalConferenceonEducationalDataMining,250-257.

[19]Ekman,P.&Friesen,W.(1978)FacialActionCodingSystem,ConsultingPsychologistPress,PaloAlto,CA.

[20]Ez-Zaouia,M.,Lavou,&Elise.(2017).Emoda:atutororientedmultimodalandcontextualemotionaldashboard.InternationalConferenceonlearninganalytics&knowledge,429-438.

[21]Joksimovi,S.,Manataki,A.,Gaevi,D.,Dawson,S.,Kovanovi,V.,&DeKereki,I.F.(2016).Translatingnetworkpositionintoperformance:importanceofcentralityindifferentnetworkconfigurations,InternationalConferenceonLearningAnalytics&Knowledge,314–323.

[22]Kapoor,A.,Burleson,W.,&Picard,R.W.(2007).Automaticpredictionoffrustration.InternationalJournalofHuman-ComputerStudies,65(8),724-736.

[23]Khajah,M.,Lindsey,R.V.,&Mozer,M.C.(2016).HowdeepisknowledgetracingarXivpreprintarXiv:1604.02416.

[24]Kort,B.,Reilly,R.,&Picard,R.W.(2002).Anaffectivemodelofinterplaybetweenemotionsandlearning:reengineeringeducationalpedagogy-buildingalearningcompanion.IEEEinternationalconferenceonAdvancedLearningTechnologies,43-46.

[25]Mayo,M.J.(2001).Bayesianstudentmodellinganddecision-theoreticselectionoftutorialactionsinintelligenttutoringsystems.UniversityofCantebury,NewZealand.

[26]Nagrecha,S.,Dillon,J.Z.,&Chawla,N.V.(2017).MOOCdropoutprediction:lessonslearnedfrommakingpipelinesinterpretable.InternationalConferenceonWorldWideWeb,351-359.

[27]Pardos,Z.A.&Heffernan,N.T.(2010).Modelingindividualizationinabayesiannetworksimplementationofknowledgetracing.InternationalConferenceonUserModeling,Adaptation,andPersonalization,6075(12),255-266.

[28]Pantic,M.(2005).Affectivemultimodalhuman-computerinteraction.ACMInternationalConferenceonMultimedia,669-676.

[29]Pekrun,R.(2005).Progressandopenproblemsineducationalemotionresearch.Learning&Instruction,15(5),497-506.

[30]Picard,R.W.(1997).Affectivecomputing.MITPress.

[31]Piech,C.,Spencer,J.,Huang,J.,Ganguli,S.,Sahami,M.,Guibas,L.,&Sohl-Dickstein,J.(2015).Deepknowledgetracing.ComputerScience,3(3),19-23.

[32]Ribeiro,M.T.,Singh,S.,&Guestrin,C.(2016)."WhyShouldITrustYou":explainingthepredictionsofanyclassifier.ACMSIGKDD,1135-1144.

[33]Rich,E.(1979).Usermodelingviastereotypes.CognitiveScience,3(4),329-354.

[34]Sinha,T.,Jermann,P.,Li,N.,&Dillenbourg,P.(2014).Yourclickdecidesyourfate:inferringinformationprocessingandattritionbehaviorfrommoocvideoclickstreaminteractions.EMNLPWorkshoponModellingLargeScaleSocialInteractioninMassiveOpenOnlineCourses.

[35]Slater,S.,Baker,R.,Almeda,M.V.,Bowers,A.,&Heffernan,N.(2017).Usingcorrelationaltopicmodelingforautomatedtopicidentificationinintelligenttutoringsystems.InternationalConferenceonLearningAnalytics&Knowledge,393-397.

[36]Stansfield,J.L.,Carr,B.P.,&Goldstein,I.P.(1976).WumpusadvisorI:Afirstimplementationofaprogramthattutorslogicalandprobabilisticreasoningskills.AtLabMemo381,MassachusettsInstituteofTechnology,Cambridge,Massachusetts.

[37]Tang,S.,Peterson,J.C.,&Pardos,Z.A.(2016).Modellingstudentbehaviorusinggranularlargescaleactiondatafromamooc.arXivpreprintarXiv:1608.04789.

[38]Thai-Nghe,N.,Horváth,T.,&Schmidt-Thieme,L.(2010).Factorizationmodelsforforecastingstudentperformance.InternationalConferenceonEducationalDataMining,11-20.

[39]Veeramachaneni,K.,Dernoncourt,F.,Taylor,C.,Pardos,Z.,&O’Reilly,U.M.(2013).MoocDB:developingdatastandardsformoocdatascience.AIEDworkshops,17.

[40]Wang,Y.&Heffernan,N.T.(2012).Thestudentskillmodel.Internationalconferenceonintelligenttutoringsystems,399-404.

[41]Yudelson,M.V.,Koedinger,K.R.,&Gordon,G.J.(2013).IndividualizedBayesianknowledgetracingmodels.Internationalconferenceonartificialintelligenceineducation,171-180

[作者简介]

徐鹏飞,博士,讲师,北京师范大学信息科学与技术学院。

郑勤华,博士,副教授,硕士生导师;陈耀华,博士研究生;陈丽,博士,教授,博士生导师。北京师范大学远程教育研究中心。

THE END
1.数据挖掘的应用嘲有哪些数据挖掘的应用场景主要有: 1、金融公司、银行的分析场景; 2、医疗保健领域和保险领域; 3、在交通运输领域中的应用; 4、数据挖掘在医学领域的应用; 5、教育; 6、制造工程。此外可以利用大数据实现智能交通、环保监测、城市规划和智能安防。车辆监控,车辆调度,通过流量分析,进行公交线路调整,通过大数据分析预测路段车辆https://www.linkflowtech.com/news/2012
2.数据挖掘的应用嘲都有哪些?数据挖掘的应用场景都有哪些? 1.教育领域 数据挖掘技术的应用已经渗入到教育教学的各个方面,如支持教育科学决策、实施个性化教育、对学生的学业成绩进行评估等。数据挖掘的实际应用逐渐突破了传统的教学模式,改善了教学效果,促进了教学质量的提升。 2.风控领域https://m.hqqt.com/webnews/16092935968229.html
3.研究丨嘲:大数据挖掘的新标准这些数据为用户生活提供了便利,但数据剩余、数据滥用和隐私暴露问题却成为了新时期的焦点。要使得这些数据更好的为受众所用,需要真正的找到目标受众。新媒体时代,要真正的找到目标受众,就要确定受众的精准方向,保证他们长期的忠诚度和深度卷入,因此,提出基于场景的大数据挖掘概念。https://www.51cto.com/article/520776.html
4.数据挖掘的实践案例:如何将理论知识应用到实际问题中数据挖掘是一种利用统计学、机器学习、操作研究、知识发现和数据库等方法从大量数据中发现新的、有价值的信息和知识的过程。数据挖掘可以帮助企业更好地理解市场、优化业务流程、提高产品质量、提高客户满意度等。数据挖掘的应用范围广泛,包括市场营销、金融、医疗保健、生物信息学、气候变化等领域。 https://blog.csdn.net/universsky2015/article/details/135803267
5.挖掘数据应用嘲有哪些帆软数字化转型知识库挖掘数据的应用场景有商业决策、市场营销、风险管理、客户关系管理、医疗健康、金融服务、物流管理、智能制造、公共服务和教育等。商业决策是其中应用最广泛且最重要的一个方面,通过数据挖掘,企业可以识别出市场趋势、客户需求和竞争对手的动向,从而制定更精确的商业策略。比如,零售企业可以利用数据挖掘分析消费者的购买行为https://www.fanruan.com/blog/article/569103/
6.人工智能算法的应用嘲有哪些问答人工智能算法的应用场景非常广泛,包括但不限于以下几个方面:1. 自然语言处理:人工智能算法可以用于自动翻译、文本情感分析、语音识别、机器翻译、信息抽取等任务。2. 机器学习和数据挖掘:人工智能算法可以用于数据分类、聚类、回归分析、推荐系统等任务。3. 图像识别和计算机视觉:人工智能算法可以用于图像分类、目标检测https://www.yisu.com/ask/66526168.html
7.遗传算法应用嘲有哪些数据挖掘 BML Codelab基于JupyterLab 全新架构升级,支持亮暗主题切换和丰富的AI工具,详见使用说明文档。 遗传算法的应用场景有:1.欺骗深度学习(通过生成某些混乱的图片对模型进行欺骗)。2.生成正则表达式(控制正则表达式的长度)。3.机器人路径规划(路径探索)。4.诗词生成等方面(进行语义加权)5.函数优化(优化函数的最https://aistudio.baidu.com/aistudio/projectdetail/5108440
8.计算机视觉五大核心研究任务全解:分类识别检测分割人体分析实例分割:更细致地在视频中对单个实例进行分割,应用场景包括医学影像、智能监控等。 2.5.4 视频摘要与高亮检测 视频摘要与高亮检测的目的是从大量视频数据中提取关键信息。 基于关键帧的方法:选择具有代表性的帧作为摘要,用于快速浏览或索引。 基于学习的方法:如使用强化学习选择精彩片段,应用于自动生成比赛精彩时刻回放https://developer.aliyun.com/article/1424822
9.(转载)微软数据挖掘算法应用嘲介绍ThinkDifferentMicrosoft关联规则算法就是用来挖掘关联关系的典型算法 需求场景: 关联规则算法是在大量数据事例中挖掘项集之间的关联或相关联系,它典型的应用就是购物篮分析,通过关联规则分析帮助我们发现交易数据库中不同的商品(项)之间的联系,找到顾客购买行为模式,如购买某一个商品对其它商品的影响。进而通过挖掘结果应用于我们的超市https://www.cnblogs.com/littlewu/p/6063402.html
10.工信部发布5G+工业互联网应用嘲和应用行业本文总结了“5G+工业互联网”在协同研发设计、远程设备操控、设备协同作业、柔性生产制造、现场辅助装配、机器视觉质检、设备故障诊断、厂区智能物流、无人智能巡检和生产现场监测十大典型应用场景和电子设备制造业、设备制造业、钢铁行业、采矿行业和电力行业5个重点行业的典型应用情况,向更多行业和企业应用“5G+工业互联网http://yunrun.com.cn/news/3801.html
11.国网浙江电力:多嘲绿氢应用示范,探路“双碳”新支柱千百年来,如何挖掘能源,为我所用,一直是人类孜孜以求的目标。在经济高质量发展和“双碳”目标稳步推进的背景下,氢能因具有终端清洁低碳属性和跨界应用潜力,在构建清洁低碳安全高效的能源体系,助力能源电力行业实现绿色转型之路上,正成为聚光灯下的“金矿”。https://www.thehour.cn/news/565042.html
12.各种机器学习的应用嘲分别是什么?雷峰网雷锋网按:本文作者xyzh,本文整理自作者在知乎问题《各种机器学习的应用场景分别是什么?》下的回答, 雷锋网获其授权发布。 关于这个问题我今天正好看到了这个文章,讲的正是各个算法的优劣分析,很中肯。 正好14年的时候有人做过一个实验[1],比较在不同数据集上(121个),不同的分类器(179个)的实际效果。 https://www.leiphone.com/news/201712/RqsxWpjPOPFy6Qm4.html