浙江省中小学教育质量监测中心浙江省教育厅教研室方张松第1页,共174页。2312考试与命题改革考试评价改革2学考测验与作业设计主观题编制与评分标准4综合素质评价与应用
第2页,共174页。3一、考试与命题改革问题
(一)学生在中、高考中失分因素分析1.阅读能力亟需提高
对涉及的一些重要事物和事实认识不全面,对重要概念、原理的理解不到位,是学生失分的另一个重要原因。约占失分总量的20%,文理各科的情况相差不多。
建议阅读(美)琳达·达林-哈蒙德等人的近著《高效学习——我们所知道的理解性教学》,华东师范大学出版社2010年出版。第11页,共174页。123.独立思考能力欠缺
4.书面表达水平不高
书面考试,其非选择题部分,最终是考查了学生的书面表达水平。学生的书面表达能力不足,仍然是各学科不可小视的一个重要失分原因。文科答卷主要表现为废话太多,词不达意;理科答卷多表现为步骤不完整和表达不准确。第21页,共174页。22(二)考试命题-总原则
强化弱化测验内容学科核心内容枝端末节内容测验结构良好结构的知识零散的知识测查能力层次概念、原理的理解与应用单纯的事实分析、综合等思维能力内容记忆测查角度学生理解了哪些不理解哪些第22页,共174页。23信度的概念定义指标信度系数
信度指数
连续性
【试题】嘉兴市小学数学六上调研试题第25页,共174页。指向于活动经验的评价与检测第26页,共174页。指向于活动经验的评价与检测第27页,共174页。指向于活动经验的评价与检测第28页,共174页。指向于活动经验的评价与检测第29页,共174页。指向于活动经验的评价与检测第30页,共174页。指向于活动经验的评价与检测第31页,共174页。重点?重点?第32页,共174页。
数学课程内容不仅包括数学的结果,也包括数学结果的形成过程和数学思想方法。第33页,共174页。1.照样子,画图解释算式的意思。
12×1323×45算法——意义——算理【试题】嘉兴市六上期末试题第34页,共174页。35(三)基于学科核心素养的课程1、对考试态度的差别这是中国教育与国外教育最大差别考什么、怎样考试、怎样运用考试结果全世界除了中国的中考,考试具有可比性的内容选择原则:西方命题的原型问题量尺分数计分:表现题目的内容和能力第35页,共174页。36某市某一天收到的厨余垃圾的统计图第36页,共174页。37问题(1)试求出m的值;(2)杭州市那天共收到厨余垃圾约200吨,请计算其中混杂着的玻璃类垃圾的吨数.第37页,共174页。38某地2月18日到23日PM2.5浓度
第38页,共174页。39问题①18日的PM2.5浓度最低;②六天中PM2.5浓度的中位数是112μg;③这六天中有4天空气质量为“优良”;④空气质量指数AQI与PM2.5浓度有关.其中正确的说法是()第39页,共174页。40汉字编码信息保护百度下载券密码检测程序点菜程序制作微课奇偶校验局域网组网几何图形绘制网络故障处理慕课学习文档选取知识抢答系统多媒体信息加工信息采集与交流会场安排问题班费管理班级展示线路问题冗余字段不明来历的照片选考科目统计数码成像考试知识点整理家庭宽带智能停车场试题英语学习IP协议发展发红包社团纳新数字时钟数据压缩调查问卷手机定位领养小狗照片收藏快打单词手机遥控器集成应用随机抽题工作日志信息甄别信息加密四角号码二维码颜色探究信息安全宣传群发邮件高中信息技术试题情境第40页,共174页。41
情境设计示例——化学试题要素内容问题情境生活实际情境生活中的化学现象,食品使用与安全,生活用材料的使用与防护,居室环境保护等。工业生产情境化肥、农药的生产与使用,化工产品的工业生产流程,金属的冶炼与金属材料的保护等。科学实验情境高中化学实验,科学研究实验等资源利用情境海水和矿物资料利用,生产和生活废弃物利用等社会热点情境新能源的开发利用,空气、水污染的防治,新材料的开发利用,化学学科前沿领域等。第41页,共174页。42
高中试题情景
央视网新闻:3·15晚会曝光了真实情境。某国产汽车使用普通钢板替代防腐性更强的镀锌钢板,导致汽车存在钢板生锈的安全隐患问题,钢板镀锌层的厚度可以通过国家规定的实验方法进行检测。
2013年3月1日
A7版,“用普通钢板代替镀锌板汽车车身不断生锈”一文。第42页,共174页。43核心素养题型及分布
汽车的质量事故从何而来?
“中小学书法教育”的主题阅读
(中考)
【话题背景】教育部《中小学书法教育指导纲要》指出:义务教育阶段书法教育以语文课为主,也可在其他学科课程、地方和校本课程中进行。其中,小学3-6年级每周安排1课时用于毛笔字学习。普通高中可开设书法选修课。第48页,共174页。49
【调查数据】
一项网络调查显示:
◎71.4%的受访者表示一个人的字代表着一个人的形象气质;
◎72.5%的受访者曾经有拿字帖练字的经历;
◎42.5%的受访者认为自己的字拿不出手;
◎74.7%的受访者认为,即便在互联网时代,写一手好字仍很重要。
(摘自《中国青年报》)
A.教育部要求,小学3-6年级每周要安排1课时练习书法,普通高中要开设书法选修课。
B.从调查数据可以看出,书法教育进中小学课堂有较好的社会基础。
C.有反对者认为,互联网时代,写字的机会越来越少了,也就没有必要学写毛笔字了。
D.中国书法是世人公认的最高艺术,它具有审美价值,能丰富人的想象力。2.根据以上几则材料,分条概述中小学生学习书法的意义。答:▲3.根据以上材料,分析中小学书法教育目前存在的不利因素。答:▲4.就激发学生书法学习兴趣的问题,结合以上材料,给学校提几点建议。答:▲
学业表现量尺分数表现水平根据学生的作答情况,采用项目反应理论模型将学生能力分数转换成的测验标准分数。如2014年初中监测样本学生的数学平均成绩为500分,标准差为100分。表现水平(PerformanceLevel)是对学生的分数做出解释,说明达到某个分数的学生能够做什么。第56页,共174页。57数学学业表现水平的临界量尺分数
追问“怎样想?”,一则可以了解学生是以怎样的方法来作出推理判断的,找到错误的症结;二来还可以知道学生思维间的差异,有的可能是瞎猜的,有的则是基于合理的思考的(根据意义来判断,合理排除)。例一:小学数学某次测评中的一道习题基于“能力立意”的学科测评实践第62页,共174页。例二:小学语文“习作”专项测评第63页,共174页。总体而言,仍然是模糊的,笼统的,对教学指导是不明确的。例二:小学语文“习作”专项测评第64页,共174页。例二:小学语文“习作”专项测评第65页,共174页。例二:小学语文“习作”专项测评第66页,共174页。例二:小学语文“习作”专项测评第67页,共174页。例二:小学语文“习作”专项测评第68页,共174页。活动测试:表现性评价
2006年起,在小学英语和小学科学学科素养评价中开始实践。
形式:
英语,以口语交际为主;科学,以动手实践为主。基于“能力立意”的学科测评实践第69页,共174页。例三:小学科学的表现性评价活动第70页,共174页。例三:小学科学的表现性评价活动第71页,共174页。
在科学表现性任务评价的设计中,着眼于测评学生对科学实践活动的设计与操作、对实践过程中所产生的现象的观察与解释能力。
总之,无论是纸笔测试,还是活动测试,学科测评的眼光转向了学生的学科素养,为教学促进学生的素养发展提供了更为全面的依据。第73页,共174页。74
作业布置:语文教师布置的作业95%为抄写、背诵及记忆题,客观题占统治地位中、高考:主观题与客观题的比例从未超2:8
考试学的角度:只有主观题才能考查高层次能力和高品质思维二、学考测验与作业设计问题第74页,共174页。75(一)内容与作业难度国际比较1、高中初中教材内容与习题的难度:我国高中各学科与发达国家比较处于中等水平(来自于部高中课改综合组信息)初中数学内容与习题难度与美国、日本、澳大利亚比处于中等与中下水平。2、初中数学内容与习题的广度与深度:处于下等水平,主要表现在应用背景的国际视野与实践能力要求上。第75页,共174页。76为什么难度不高且负担很重?太多的重复操练(练习的质与量,欧洲学生的3.5倍)功利化课外加深(作业不协调有老师的有辅导班的)忽视个体间差异(对不同学生的要求一刀切)无视低高段区别(低段习作与考试价值核心是学习)考试形式单一化(考试与测量学技术的限制)第76页,共174页。77案例:美国阅读题
《谈第二次世界大战》后思考题:你认为纳粹德国失败的原因是什么?为什么会发生日本偷袭美国珍珠港成功的事件?如果你是杜鲁门总统的高级顾问,你将对美国向日本投放原子弹持什么态度?第77页,共174页。78
案例:日本的历史考题
日本跟中国100年打一场仗,19世纪打了一场日清战争(甲午海战),20世纪打了一场日中战争(抗日战争)。21世纪如果日本跟中国开火,你认为大概是什么时候?可能的远因和近因在哪里?如果日本赢了,是赢在什么地方?输了会输在什么条件?第78页,共174页。79案例:中国的历史考题
甲午战争是哪一年爆发的?签了什么条约?割了多少地?赔了多少银两?第79页,共174页。80(二)作业设计创新
文科考生试题(三选一)1.
尊重所有生命是一种道德义务吗?2.
我是由我过去经历所塑造的吗?3.
对法国政治哲学家亚历西斯·德·托克维尔《论美国的民主》中的一段文本作出解读。“无论什么时代,或多或少总是存在着专断的信仰。信仰产生的方式不同,其形式和对象也会产生变化;但是完全没有信仰,就是说没有人们不经争论、放心接受的意见,那是不可能的……”
83第83页,共174页。2015年法国高中会考作文理科考生试题(三选一)1.
政治与真理无关?2.
艺术品总包含着一定的意义?3.
1)叮叮叮,叮叮叮;2)啊,啊,啊,啊;3)呜呜呜,呜呜呜;4)喵喵,喵喵,喵喵。题目5:例如,爸爸+妈妈+我=吉祥三宝。请问:2/3青蛙=?脚-鞋袜+草地=?爸爸+妈妈+我=?一个喷嚏+一个喷嚏+一个喷嚏=?狗血+鸡毛=?()第87页,共174页。88三、主观题编制与评分标准问题(一)主观题评分标准不够标准问题十年的统计,60%的评分标准有问题,主要是不适合高中学生的作答。评分标准怎么来的问题:学生立场还是专家立场?PISA特点:尊重个体差异,标准答案来自于学生,按层次设计分值第88页,共174页。89
机械生硬的教育最终的结果第89页,共174页。90比较类别
客观题主观题测量功能优势:知识、领会、应用、分析不足:综合、评价
优势:综合、评价领会、应用、分析不足:知识内容取样题量大,取样广泛,内容领域的代表性强题量小,取样范围有限,代表性有限题目编写指定高质量试题非常困难、耗时长相对较容易评分客观、简单、高信度主观、复杂、低信度影响学生分数的因素阅读能力、猜测能力阅读能力、写作能力教学导向记忆、解释、分析能力有条理地组织、统整、表达自己的观点(二)主观题的特质第90页,共174页。91
___________学科双向细目表(参考模板)
记忆
一致
原创
2
理解
偏高
改编
3
应用
偏低
借用
4
分析
5
评价
6
创造
命题蓝图第91页,共174页。92对主观题(开放题)的认识认知分类知识理解应用分析综合评价开放性问题描述比较分析问题解决写作评价思维技能回忆收集信息组织分析头脑风暴假设整合评价第92页,共174页。93
命题蓝图第93页,共174页。94阅读开放题的两大类型
……X:推开门一看,屋里坐着一位老者,正在给学生讲题Y:我想,这就是我要找的老教师吧Z:门上贴着一幅“桃李芬芳”的对联
辛美韦斯最终成功地减少了由产褥热引起的死亡率,但时至今日,产褥热仍然是一种难以消除的疾病。难以医治的产褥热仍是医院要面对的问题。现在,医院订立了很多规范程序来控制这个问题,其中一项是用高温清洗床单。试解释为什么高温(用来清洗床单)可以帮助降低病人染病的机会?问题:满分的答案:
编码11----指出高热能杀死细菌
编码12----指出高热能杀死微生物、病菌或病毒
编码13----指出高热能去除细菌
编码14----指出高热可以去除微生物,病菌或病毒
编码15----指出高热可以消毒床被第105页,共174页。1064、评分标准制定的两个过程:建构和检验评分标准的建构:专家的构想,自上而下第一步,明确测量的目标,列出其要素第二步,预计学生可能的答案,并进行归类第三步,给各类答案分层,赋分评分标准的检验:学生的表现,自下而上以学生作答数据为基础;第一步,试用标准第二步,修订标准(预试后完成)第三步,实证和定稿(正式测试后完成)第106页,共174页。107
(四)关于SOLO分类理论的应用各发展阶段中学生的发展水平--前结构(pre-structure)--单一结构(uni-structure)--多元结构(multi-structure)--关联结构(relational)--拓展结构(extendedabstract)注:在不同学科领域、不同题目上学生可能体现出不同的发展阶段第107页,共174页。108SOLO分层评价理论的认识
SOLO是英文“StructureoftheObservedLearningOutcome”的缩写,意为“可观察的学习成果结构”。是一种以等级描述为特征的质性评价方法,该理论以学生作答所表现的思维结构来表征各级水平,核心精神是追求思维的广阔性和深刻性,内在的体现了新课程标准提出的“积极倡导自主、合作、探究的学习方式”。第108页,共174页。109(1)回答能力(知识容量)
(2)回答思路(思维操作)
(3)回答的一致性和相对收敛程度(指材料与结论间无矛盾,结论间也不存在矛盾)
(4)回答的整体结构(回答问题的情况——所运用的素材、论述的过程与方法以及结论三者之间关系)
这四个特征,对学习者进行分类,将学生的学习结果(对问题的回答)由低到高划分为五个层次。从具体到抽象,从单维到多维,从组织的无序到有序。从而间接地判断学习者的认知发展水平。前一种水平的发展是后一种水平发展的基础。比格斯通的实践研究,根据学生的第109页,共174页。110
从上述分层法中我们首先可以看到,比格斯提出的思维分层结构是一个由简单到复杂的层次类型,具体说来就是点-线-面-立体-系统的发展过程,思维结构越复杂,思维能力的层次也就越高。其次,SOLO分层的焦点集中在学生回答问题的“质”,而不是回答问题的“量”上。力求能够准确评价学生思维能力所能达到的深度和广度。第110页,共174页。111关于SOLO分类理论在命题中的应用利用SOLO分类理论编制客观题例如:你认为这个故事主要讲的是:
A.小松鼠很贪玩,春天夏天都在玩儿(单一水平)。
B.小松鼠很重视和兔子的友谊(前结构水平)。
C.在兔子的帮助下,小松鼠吸取教训,知道要储存过冬的粮食了(关联水平)。
D.去年冬天小松鼠因为贪玩,没有储存过冬的粮食,所以很狼狈(多元水平)。第111页,共174页。112
关于SOLO分类理论在命题中的应用例如:(数学)按下列要求摆放桌子和椅子,1张桌子可坐6人,2张桌子可坐10人,等等。单一结构:3张桌子可坐几人?多元结构:摆5张桌子比摆3张可多坐几个人?关联结构:要坐34个人需要摆多少张椅子?扩展抽象结构:n张桌子可以坐多少人?第112页,共174页。113四、综合素质评价与应用小学阶段:鼓励综合评价改革百花齐放,但差异大,不规范。不作统一要求但作示例研究,以求相对规范。初中阶段:总体黯淡。实施好的呈现两种类别,一是鲜艳无比,但操作性差,难评价;一种应用于招生,重操作讲实在,不够“鲜艳”。第113页,共174页。114一个整体:以人为本,全面发展。三个主题:人、自然和社会。五个素养:学科素养、方法素养、社会素养、自我素养、国际化素养。七个课程群:阅读与表达课程群、逻辑与探究课程群、审美与艺术课程群、运动与健康课程群、实践与创新课程群、合作与交流课程群、综合与素养课程群。一、核心素养的校本化理解第114页,共174页。115二、聚焦核心素养,明确评价目标
我们设计的综合素质评价就要围绕这些核心素养,开设系列课程,包括实践类课程,促进学生认识自我、规划人生、激发潜能、主动发展,走出教室、走向社会,在社团活动中培养兴趣,在社会实践中经受锻炼,全面提升学生各方面的综合素质,从而培养更多的符合社会需要的合格人才和精英人才。第115页,共174页。116类别课程群年级课程名称学年总课时数实践活动类实践与创新课程群七八九年级我是小创客——3D打印设计人人都能开发17节安卓APP17节视音频制作17节电子小制作17节电子制作与测向17节模型制作17节我的名字叫“口金”17节合作与交流课程群七八九年级演讲与辩论17节实用对话情景教学17节我是小小外交家系列——德语、日语、法语17节Let’sHaveFuninEnglish17节Englishmovies&songs17节九年级走进法律17节
礼仪与责任(即时性课程)课程群
七八九年级学习习惯课程(预习习惯养成、有效的课后纠错、课堂笔记指导、复习计划的制定与落实、学习资料的检索和整理……
第116页,共174页。117三、整合评价体系,凸显方法和交往一级指标二级指标三级指标评价载体
、自我素养道德素养·道德意识·道德行为建兰美少年日常行为规范体质健康·体育锻炼·卫生保健·身体形态、机能与素质体育达标体育节军训
自我认识·认识自我·调控自我心理周
艺术审美·对美的感受能力·对美的欣赏水平·对美的表现能力艺术节社团活动
生活中的应用水平学业水平测试美食节科技节学习能力·问题解决能力·反思能力·探究能力小鬼当家
学业情感·学习态度·学习兴趣·学习意志金兰奖、银兰奖金马、银马、白马、黑马奖创新能力·活动成果·设计与制作成果·其他成果科技节劳技周
第118页,共174页。119三、整合评价体系,凸显方法和交往建兰中学学生综合素质评价体系一级指标二级指标三级指标评价指标(部分)、
方法素养学习方法·规划自我成长·持续学习的能力三年发展规划薪火学社人际交往·尊重、信任、关心他人·合作与交流新生护照志愿者服务适应环境·适应学习环境·适应社会环境野外拓展训练
信息处理·信息意识·信息技能·信息道德
模拟联合国
四、社会素养责任担当·敢于承担·勇于奉献·积极参与·诚实守信参加各类公益活动志愿者服务
求同存异·善于悦纳
五、国际化素养国际理解·国际视野·国际交流名家大师进建兰游学第119页,共174页。120潍坊市中考招生改革
1、综合录取:依据学业水平考试等级和考生综合素质等级进行录取,一般占招生总人数的80%左右。2、推荐录取:主要通过两名具有一定诚信资质的初中教师联名直接向高中学校推荐。占招生总人数的5%左右。3、艺体特长生:录取的主要依据以艺体特长为主,参考学业水平考试成绩、综合素质评价等进行,占15%左右。第120页,共174页。121潍坊市综合素质评价
由学生报考的第一志愿高中学校负责,采用A、B、C、D、E五个等级,评价的依据主要有四个方面:一是依据初中学校对学生成长记录评价的结果:道德素养、交流与合作能力、运动与健康、审美与表现。二是依据学生的标志性成果。三是依据学生参加综合实践活动的表现和学分。四是依据学生现场的个性化特长展示。第121页,共174页。122潍坊市中考改革——内容能力立意
第一,严格按课程标准命题,不得“超纲”拔高;第二,取消死记硬背机械训练题目;第三,课本上和教辅上的现成题目不得进入试题;第四,密切联系学生生活实际;第五,解决实际问题的题目不少于50%;第六,开放性题目不少于30%;第七,从形式到内容的创新题每年增加1/3。比如,政治科目考试,只保留“主观思辩题”一种题型。第122页,共174页。123国外选择性与多样性
教学中主要质量问题
(三)课堂评价问题课堂评价在教学中的作用教学前教学中教学后建立目标学生的准备状态选择教学策略;搜集所需材料制定评估与评价计划实施教学策略确定教学策略的成效
评价目标实现的程度
重新评价学生的准备状态第154页,共174页。155联合国教科文倡导的12条教学策略
建立激励性的课堂气氛
学习的机会
课程结构
建立学习心向
连贯一致的内容
精心设计的课堂讨论
实践与应用活动
支持学生参与学习
方法教学
合作学习
注重学习目标的评价
课堂评价工具介绍-学习诊断系统教师使用学习诊断系统后的体会第157页,共174页。158前测创建学生档案建立教学小组提供针对性教学观察和监控使用数据来计划和评估课程,并给出反馈后测日常教学更新学生档案
课堂评价迈克尔*富兰模型第158页,共174页。159犹如从炮弹到导弹,提高其精确性。
课堂评价的时代使命——基于数据改善教与学。第159页,共174页。160(四)大数据的4大特点大量Volume高速Velocity多样Variety价值Value第160页,共174页。161数据在教育领域中具体构成含有意义的数据:海量的学生试卷及练习题加工数据的手段:教育软件数据增值的形式:计分电子表格、学生错题本、学业诊断报告、个性化学习包、学生学业信息档案、学科内容评价报告单。学生个人的学习能力分布;班、年级各层面的成绩分布;知识点掌握程度;出卷质量;试卷组合查询等。第161页,共174页。162教育大数据在国外的现状大数据在美国联邦教育决策中发挥了极为重要的作用。其中最为典型的一个例子就是全国教育进展测评(NationalAssessmentofEducationalProgress,简称NAEP)。NAEP产生于1969年,其目的是监测美国中小学生学业成就现状和发展趋势,提高美国基础教育质量。美国1969年已经在全国使用大数据跟踪监