摘要:近五年网络教育的变革和深度学习等人工智能技术的飞速发展给学习者模型的研究和应用带来了新的机遇和挑战。目前,教学数据中蕴含的大量价值亟待挖掘,而实践中绝大部分教学环境对学习者的理解、状态跟踪和自适应性仍处于初级阶段。如何从数据中建立学习者模型、如何在教学环境中设计和使用学习者模型是下一阶段教育变革的核心技术问题。为此,本文从知识状态模型、认知行为模型、情感模型和综合模型四个类别分别阐述了具有代表性的学习者模型及其主要应用场景。研究认为,深度学习未来将在学习者模型的研究和实践中扮演重要角色,而基于各种学习者数据对学生进行全面而综合性建模的综合模型应用是大势所趋。
关键词:在线教育;在线学习;学习者模型;学习分析;教育数据挖掘
一、引言
当前,我国的教育信息化发展进入到以有效支持教与学、促进学生个性化发展为核心诉求的新阶段。《教育信息化十年发展规划(2011-2020年)》在基础教育信息化发展水平框架中提出,学校教育教学方式的变革要在学生多样性、个性化学习的改变上取得突破。《国家中长期教育改革和发展规划纲要(2010-2020年)》也指出,“关心每个学习者,促使学生更加主动积极地发展,尊重教育规划和学生身心发展规律,为每个学生提供适合的教育”。在这一进程中,对学习者模型的研究尤为重要。
学习者模型是对真实学习者的一种抽象表示,代表了学习者的知识技能、认知行为、情感体验等方面的水平和特征(Chrysafiadi&Virvou,2013)。在智能辅导系统中,学习者模型扮演着大脑的角色,它可以在学习者学习的过程中跟踪其状态的变化,并自适应地给学习者提供合适的交互。而在大规模在线学习环境中,学习者模型可以对大规模的学习者进行定性或定量描述,为教师和学习环境设计人员的决策提供重要参考。在大数据和人工智能的时代,学习者模型有着非常广阔的研究空间和应用场景。
二、以知识状态为基准的学习者模型
表1贝叶斯知识跟踪(BKT)的四个参数
基本BKT模型中的四个参数分别是针对各个技能点和题目设置的,并没有考虑学生个体在能力上的差异。针对该局限性,Wang和Heffernan(2012)、Pardos和Heffernan(2010)分别对BKT模型提出了多种扩展,通过增加隐式节点使模型能够模拟学习者在个体能力上的差异。Yudelson、Koedinger和Gordon(2013)通过比较各种个性化扩展的方式,发现在习得概率p(T)上的个性化对模型的预测效果有较大的作用;相比之下,针对p(L0)的个性化对模型的预测效果的提升较小。
三、以认知行为为基准的学习者模型
学习者知识状态模型一般仅仅基于学习者的测评数据进行建模,但实际上学习者在教学环境中留下的数字足迹远不止测评数据,这一点在学习管理系统(LMS)和大规模在线学习环境下尤为明显。彭文辉等(2006)从信息检索学习行为、信息加工学习行为、信息发布学习行为、人际沟通交流行为、基于问题解决的学习行为五个维度构建了多维度的网络学习行为模型。Veeramachaneni等(2013)则将MOOCs下学习者的行为分为观察、提交、协作三类。观察类行为指的是学习者浏览和观察网站上的资源,如维基、论坛、授课视频和电子书等的行为;提交类行为指的是学习者提交自己生成的内容和反馈,如作业、考试、测验、练习、笔记、实验等;在协作类下,学习者与其他学习者产生交互,如论坛模块内的讨论、维基模块内的协同编辑等。尽管学习者认知行为模型的研究和应用并不仅仅受限于MOOCs这一个学习环境,但MOOCs由于其较大的学生规模、多样并开放的交互方式,无疑为学习者认知行为模型的研究提供了非常好的土壤。
依据学习者的行为数据,我们可以选取合适的特征对学习者进行分组。例如,Anderson等(2014)根据观看视频和提交作业的情况,将学习者按照投入模式分为观察型、解题型、全面型、收集型和局外型五个类别。观察型主要观看视频,很少提交作业;解题型与其相反,主要行为是提交作业,而观看视频行为则很少;全面型综合了观察型和解题型,既观看视频也提交作业;收集型也很少提交作业,但他们主要是下载视频,至于有没有观看则无从知晓;局外型则是注册了课程但整体行为量低于一定阈值的不活跃用户。宗阳等(2016)基于学习平台上记录的行为数据和RFM模型将学习者分为八个学习者价值类型,每个类型都具有不同的行为特征。
和深度知识跟踪模型(DKT)类似,Tang等(2016)也提出了面向学习者行为的深度模型。该深度行为模型可以根据学习者的历史行为来预测学习者下一步的行为,实验显示和传统模型相比,深度模型在预测准确率上有一定的优势。该深度模型和深度知识跟踪模型(DKT)一样采用循环神经网络来表示学习者,但该行为模型考虑了学习者所有类别的行为数据,而不仅仅是DKT所考虑的评测数据。此类模型的应用场景可能包括自动化推荐系统:系统可以根据学习者的历史行为来预测其下一步行为,评估该行为是否会达到理想的学习结果,并进一步选择是否干预以及合适的推荐内容。
四、以情感为基准的学习者模型
在采集多模态的数据之后,情感建模往往需借助机器学习领域的模型和技术来处理多模态数据的复杂性和情感识别过程中的不确定性。例如,Kapoor、Burleson和Picard(2007)采用特征提取和情感分类两个模块从多模态数据中构建情感建模。而Conati(2002)则基于人脸、皮肤电传导、心跳等数据,采用动态贝耶斯网络来监控学习者情感。总的来说,有两种多模态数据的融合策略:一种是特征层融合,基于不同模态构建特征向量,用于分类器的输入;另一种是决策层融合,每个模态都有自己单独的分类器,而这些分类器的结果将组合在一起用作一个最终分类器的输入。尽管特征层融合有可能获得更好的识别效果(Caridakisetal.,2008),但是决策层融合无疑具有更加模块化的优势(Pantic,2005)。采用决策层融合的策略,开发者可以直接调用第三方提供的情感识别API,从而大大简化了情感模型的构建。
目前,在学习者情感模型中常用的特征有人脸图像或视频、语音和文本等(Ez-Zaouia,Lavou,&Elise,2017)。可以预见,随着普适计算、穿戴式设备、情感计算和人工智能等领域的发展,学习者情感模型将更加多模化与智能化,其应用场景也更为广阔。
五、学习者综合模型
学习者综合模型指的是对学习者多个方面进行综合而建立的整体性模型。例如,在自适应学习系统中可以通过对学习者的知识水平、认知能力、偏好信息进行综合性建模,提高自适应学习系统适应学习者的能力(贾冰,2010)。除了在自适应学习系统中的应用外,学习者综合模型还有两类比较典型的应用场景。一类是预测性模型,这类模型为了提高预测准确率而综合考虑了学习者的多种信息;另一类是评价性模型,这类模型为了提高评价的客观性和全面性,也尽可能多地考虑学习者的多种信息。
预测性学习者综合模型的一个典型应用场景是MOOCs环境下的退学预测(Nagrecha,Dillon,&Chawla,2017)。因为高退学率是MOOCs最显著的一个缺点,所以退学预测一直是MOOCs研究的一个重要主题。退学预测的大多数研究采用的是监督式分类的方法,系统可以采用点击流、作业评分、社会网络甚至人口学信息等多种数据源,通过特征工程和机器学习算法来优化预测准确率。这类学习者综合模型虽然综合了学习者在多个方面的信息,但模型的可解释性存在一定的挑战。目前主要有两种方法可以保留预测性模型的可解释性:第一种方法是需要采用线性模型、决策树等可解释的分类技术,这种方式可能要损失一定的预测表现;第二种方法是使用Parzen(Baehrensetal.,2009)或LIME(Ribeiro,Singh,&Guestrin,2016)等模型解释技术。
评价性学习者综合模型的提出则主要为学生评价服务,需要以教学目标作为价值判断的依据和准绳。例如,郑勤华等(2016)以学生综合评价为目标,通过理论演绎和专家访谈构建了以投入度、完成度、调控度、联通度和主动性为核心的五维度综合评价参考理论模型,并通过学习行为数据聚合特征变量,构建了相应的计算模型,如图1所示。其中,投入度从活跃性、持续性等方面对学生在线学习的投入程度进行评价;完成度以课程的教学目标为标准对学生实际完成情况进行评价,对于不同类型的课程教学目标的侧重点不同,完成度的指标以及权重设置也会进行相应调整;主动性包括完成自主学习任务的主动性、参与教师指定教学活动的主动性以及进行交互的主动性等,主动性在一定程度上表征了学习者的学习动机水平与变化情况;调控度从学习的规律性、持续性、效率等方面对学生调控自己学习过程的水平进行评价,是对学生认知策略、自主学习能力进行表征和评价的重要维度;联通度则对学生建立社会化认知网络的能力进行评价,包括建立连接的能力、维护连接的能力等。联通度的评价核心是交互,包括学生与资源的交互、学生与教师及其他学习同伴的交互。
图1学生综合评价参考模型
六、讨论和建议
[参考文献]
[1]黄焕.2014.面向e-Learning的学习者情感建模及应用研究[D].武汉:华中师范大学国家数字化学习工程技术研究中心.
[2]贾冰.2010.自适应学习系统中学习者模型的表示及特征值获取方法研究[D].长春:东北师范大学教育部数字化学习支撑技术工程研究中心.
[3]彭文辉,杨宗凯,黄克斌.2006.网络学习行为分析及其模型研究[J].中国电化教育(10):31-35.
[4]疏凤芳,赵呈领,万力勇,等.2012.基于qq群的网络课堂交互特性研究.现代教育技术,22(7):83-88.
[5]张舸,周东岱,葛情情.2012.自适应学习系统中学习者特征模型及建模方法述评[J].现代教育技术,22(5):77-82.
[6]郑勤华,陈耀华,孙洪涛,等.2016.基于学习分析的在线学习测评建模与应用——学习者综合评价参考模型研究[J].电化教育研究(9):33-40.
[7]宗阳,郑勤华,陈丽.2016.中国moocs学习者价值研究——基于RFM模型的在线学习行为分析[J].现代远距离教育(2):21-28.
[8]Afzal,S.&Robinson,P.(2010).Modellingaffectinlearningenvironments-motivationandmethods.IEEEinternationalconferenceonadvancedlearningtechnologies,438-442.
[9]Anderson,A.,Huttenlocher,D.,Kleinberg,J.,&Leskovec,J.(2014).Engagingwithmassiveonlinecourses,InternationalconferenceonWorldWideWeb,687-698.
[10]Baehrens,D.,Schroeter,T.,Harmeling,S.,Kawanabe,M.,Hansen,K.,&Müller,K.R.(2009).Howtoexplainindividualclassificationdecisions.JournalofMachineLearningResearch,11(9),1803-1831.
[11]Caridakis,G.,Castellano,G.,Kessous,L.,Raouzaiou,A.,Malatesta,L.,Asteriadis,S.,&Karpouzis,K.(2008).Multimodalemotionrecognitionfromexpressivefaces,bodygesturesandspeech.InternationalFederationforInformationProcessing,247,375-388.
[12]Chrysafiadi,K.&Virvou,M.(2013).Studentmodelingapproaches:aliteraturereviewforthelastdecade.ExpertSystemswithApplications,40(11),4715-4729.
[13]Conati,C.(2002).Probabilisticassessmentofuser’semotionsineducationalgames.AppliedArtificialIntelligence,16(7-8),555-575.
[14]Corbett,A.T.&Anderson,J.R.(1994).Knowledgetracing:modelingtheacquisitionofproceduralknowledge.UserModelingandUser-AdaptedInteraction,4(4),253-278.
[15]Craig,S.,Graesser,A.,Sullins,J.,&Gholson,B.(2004).Affectandlearning:anexploratorylookintotheroleofaffectinlearningwithAuto-Tutor.JournalofEducationalMedia,29(3),241-250.
[16]Desmarais,M.C.(2012).Mappingquestionitemstoskillswithnon-negativematrixfactorization.ACMKDD-Explorations,13(2),30-36.
[17]Doddannara,L.S.,Gowda,S.M.,Baker,R.S.J.D.,Gowda,S.M.,&Carvalho,A.M.J.B.D.(2013).ExploringtheRelationshipsbetweenDesign,Students’AffectiveStates,andDisengagedBehaviorswithinanITS.ArtificialIntelligenceinEducation.SpringerBerlinHeidelberg,31-40.
[18]Dowell,N.M.,Skrypnyk,O.,Joksimovic,S.,Graesser,A.C.,Dawson,S.,Gaevic,D.,Kovanovic,V.(2015).Modelinglearners’socialcentralityandperformancethroughlanguageanddiscourse.InternationalConferenceonEducationalDataMining,250-257.
[19]Ekman,P.&Friesen,W.(1978)FacialActionCodingSystem,ConsultingPsychologistPress,PaloAlto,CA.
[20]Ez-Zaouia,M.,Lavou,&Elise.(2017).Emoda:atutororientedmultimodalandcontextualemotionaldashboard.InternationalConferenceonlearninganalytics&knowledge,429-438.
[21]Joksimovi,S.,Manataki,A.,Gaevi,D.,Dawson,S.,Kovanovi,V.,&DeKereki,I.F.(2016).Translatingnetworkpositionintoperformance:importanceofcentralityindifferentnetworkconfigurations,InternationalConferenceonLearningAnalytics&Knowledge,314–323.
[22]Kapoor,A.,Burleson,W.,&Picard,R.W.(2007).Automaticpredictionoffrustration.InternationalJournalofHuman-ComputerStudies,65(8),724-736.
[23]Khajah,M.,Lindsey,R.V.,&Mozer,M.C.(2016).HowdeepisknowledgetracingarXivpreprintarXiv:1604.02416.
[24]Kort,B.,Reilly,R.,&Picard,R.W.(2002).Anaffectivemodelofinterplaybetweenemotionsandlearning:reengineeringeducationalpedagogy-buildingalearningcompanion.IEEEinternationalconferenceonAdvancedLearningTechnologies,43-46.
[25]Mayo,M.J.(2001).Bayesianstudentmodellinganddecision-theoreticselectionoftutorialactionsinintelligenttutoringsystems.UniversityofCantebury,NewZealand.
[26]Nagrecha,S.,Dillon,J.Z.,&Chawla,N.V.(2017).MOOCdropoutprediction:lessonslearnedfrommakingpipelinesinterpretable.InternationalConferenceonWorldWideWeb,351-359.
[27]Pardos,Z.A.&Heffernan,N.T.(2010).Modelingindividualizationinabayesiannetworksimplementationofknowledgetracing.InternationalConferenceonUserModeling,Adaptation,andPersonalization,6075(12),255-266.
[28]Pantic,M.(2005).Affectivemultimodalhuman-computerinteraction.ACMInternationalConferenceonMultimedia,669-676.
[29]Pekrun,R.(2005).Progressandopenproblemsineducationalemotionresearch.Learning&Instruction,15(5),497-506.
[30]Picard,R.W.(1997).Affectivecomputing.MITPress.
[31]Piech,C.,Spencer,J.,Huang,J.,Ganguli,S.,Sahami,M.,Guibas,L.,&Sohl-Dickstein,J.(2015).Deepknowledgetracing.ComputerScience,3(3),19-23.
[32]Ribeiro,M.T.,Singh,S.,&Guestrin,C.(2016)."WhyShouldITrustYou":explainingthepredictionsofanyclassifier.ACMSIGKDD,1135-1144.
[33]Rich,E.(1979).Usermodelingviastereotypes.CognitiveScience,3(4),329-354.
[34]Sinha,T.,Jermann,P.,Li,N.,&Dillenbourg,P.(2014).Yourclickdecidesyourfate:inferringinformationprocessingandattritionbehaviorfrommoocvideoclickstreaminteractions.EMNLPWorkshoponModellingLargeScaleSocialInteractioninMassiveOpenOnlineCourses.
[35]Slater,S.,Baker,R.,Almeda,M.V.,Bowers,A.,&Heffernan,N.(2017).Usingcorrelationaltopicmodelingforautomatedtopicidentificationinintelligenttutoringsystems.InternationalConferenceonLearningAnalytics&Knowledge,393-397.
[36]Stansfield,J.L.,Carr,B.P.,&Goldstein,I.P.(1976).WumpusadvisorI:Afirstimplementationofaprogramthattutorslogicalandprobabilisticreasoningskills.AtLabMemo381,MassachusettsInstituteofTechnology,Cambridge,Massachusetts.
[37]Tang,S.,Peterson,J.C.,&Pardos,Z.A.(2016).Modellingstudentbehaviorusinggranularlargescaleactiondatafromamooc.arXivpreprintarXiv:1608.04789.
[38]Thai-Nghe,N.,Horváth,T.,&Schmidt-Thieme,L.(2010).Factorizationmodelsforforecastingstudentperformance.InternationalConferenceonEducationalDataMining,11-20.
[39]Veeramachaneni,K.,Dernoncourt,F.,Taylor,C.,Pardos,Z.,&O’Reilly,U.M.(2013).MoocDB:developingdatastandardsformoocdatascience.AIEDworkshops,17.
[40]Wang,Y.&Heffernan,N.T.(2012).Thestudentskillmodel.Internationalconferenceonintelligenttutoringsystems,399-404.
[41]Yudelson,M.V.,Koedinger,K.R.,&Gordon,G.J.(2013).IndividualizedBayesianknowledgetracingmodels.Internationalconferenceonartificialintelligenceineducation,171-180
[作者简介]
徐鹏飞,博士,讲师,北京师范大学信息科学与技术学院。
郑勤华,博士,副教授,硕士生导师;陈耀华,博士研究生;陈丽,博士,教授,博士生导师。北京师范大学远程教育研究中心。