从这个角度,我们来看当前中国教育,其实面临着很多的问题。
从教育的结果来看,应试教育是一种对创新能力的扼杀,标准答案容易固化人的思维。这个我有很深刻的体验,许多博士学生从小学到博士,一路考来,很适应应试教育,但结果在做研究时却做不了创新,只能去读国外的论文,拿回来修修补补。另一方面,学校里学到的知识和社会的需求之间存在着巨大的鸿沟,学生往往是学习知识有余,学习「能力」很难。
当然中国的教育也同样造成了教育的不公平问题,主要体现在优质资源分布极为不均,城乡之间存在巨大的差异,在城市里出现各种学区房的现象。
当教师可选,教材可选的时候,“教”与“学”之间面临着巨大的矛盾。那么这个矛盾中,谁才是矛盾的主要方面呢?有人认为“名师出高徒”、“严师出高徒”等,教师在教学过程中发挥着主导作用。但也有人认为“师傅领进门,修行在个人”,应当依据学生的个性化来定制学习路线。例如有人建议将知识点碎片化,然后学生根据个人的特点开发自己的学习路线。但我认为,学生本身是有惰性的,而且知识(特别是理工科的知识)是有次序的。因此也应当注意“教”的重要性。
不过我们要认识到,现在的教学逐渐在朝向以学生心智为主导的方向发展。随着学习的展开,学生的心智应当发生变化,从而能够更好地适应环境,这不但是一个知识量的增加,更重要的是心智结构变得更为复杂。在这个过程中教师和机器都是学生成长的助力。
随着人工智能的再次爆发,现在大家都在提“人工智能+教育”。据我的观察这其实包括了三个方面,由于大家名词不加区分,所以这三方面经常交叠在一起。第一个是人工智能教育(ArtificialIntelligentEducation,AIEducation),讲课的内容是教人工智能,旨在培养掌握人工智能技术的人才,形象的表示如下图:
第二个是智能教育(IntelligentEducation),是用AI来辅助教学,人工智能知识教育的手段,用来促进教学流程的自动化、智能化,来提高效率,提升效果:
第三个是计算教育学(ComputationalEducation),这个是通过人工智能的技术来进行教育学的研究,通过统计分析来研究教育学的原理:
在这里,我想要讨论的是第二个,智能教育,即如何利用人工智能的技术来促进教育。我们用一张图来看下教育、人工智能与智能教育三者之间的关系:
教育是由人教人,由有知识的人教知识匮乏的人;人工智能是人来教机器;而智能教育是机器来教人或者机器辅助来教人。这是它们三者之间的关系。其实有时候计算机的学习方法对我们人类学习也是有帮助的。我们能教会计算机,同时也可以用这种方式来教人。
我也将传统教育与智能教育做了一个对比,如下表格:
传统教育主要是发生在教室,智能教育发生在空间里面,资源空间、物理空间、社交空间都可以;传统教育主要是知识的传递,而智能教育则代表能力的提升,是知识获取的引导者;传统教育是知识灌输,智能教育是互动探究式的学习;传统教育一般是以文字为主配少量的插图,我们知道只是用文字这种单一的形式会丢掉很多原汁原味的东西,文字的教学可能会限制我们的思维,智能教育则具有多元化、多模态的数字教育资源;传统教育只需要简单的技术支持,而智能教育则需要高级的数字化技术以及智能技术的支持。
从学习评价来看,传统教育受结果导向,主要表现是应试教育,智能教育是数据驱动的过程化评价,由于学生的整个学习过程可以被数字化的记录下来,所以我们可以在过程中像切片一样来看他们的学习过程。传统教育以分数为评价机制,智能教育是多元化综合评价,逐渐形成一个定量的精准化评价。
从学习路径的规划来看,传统教育是模块化的,智能教育比模块化还要更加细致和碎片化。由于有碎片化所以内容点之间可以形成一个复杂的网络。在智能教育过程当中,学生可以动态的调整学习路径,每个学生可以有自己的学习路径。
这里可以借鉴下机器学习的三种学习模式,从规则系统的角度来看,规则学习很像是填鸭式教学,人制定标准的规则,让机器照着去做(直接告诉学生知识,技巧)。然后是神经网络,大量的训练数据(大量做题)。其次是强化学习,在与环境的互动中得到反馈,进而得到提升(在探索中学习)。
在教育系统中的主要角色(学校、教师和学生),他们的主要工作以及在智能教育中所产生的产品形态,如下:
智能教育的目标如下:
在政策方面,人工智能+教育演进的速度非常快,最大的一个标志就是2017年7月国务院出台了《新一代人工智能发展规划》;随后在2019年2月国务院又出台了《中国教育现代化2035》,将“加快信息化时代教育变革”列入战略任务。
在这些主要的政策中,其主要思路有六条:
今年5月份国际人工智能与教育大会上,习总书记在讲话中提到人工智能与教育,一方面是要培养人工智能人才;另一方面就是智能教育。关于智能教育,他提到了终身教育,平等教育,个性化教育和开放灵活的教育。
国家各个部委响应国家的政策组建了F06,然后把人工智能和计算机和自动化并列组建了一个学科,叫F0701,专注于研究教育智能化、教育信息化。
我们讲下AI在教育领域的应用案例。下面是我从理工科的角度画的一张布局图,主要分成五个层次:
人工智能的核心技术包括自然语言处理、视觉、听觉等等都会在教育领域找到用武之地。我们从技术出发来找应用场景:
我最近在和学校的几位老师推动“智能监考”这件事情,其技术实质就是把异常行为检测应用到监考当中。我们学院唐降龙教授将机器视觉技术应用到体育运动当中,
例如分析滑雪的动作是否规范、什么时候应该有什么速度等。用在教学中,我们同样可以通过视觉行为分析对学生在化学实验中的实践操作过程与精度进行缺陷检测,并给出其优化学习指导,提升学校实践教学质量。
哈工大做知识图谱已经有很多年了,我们的成果是2014年推出的《大词林》,2019年推出了2.0,拥有1000万个实体,上位词十八万,目前很多企业(包括腾讯、阿里、科大讯飞、360、搜狗等多家企业)都在付费使用。大词林的优势在于当给你一个课本时,无需手工参与,能够自动构建而成知识图谱。因此可以先把一门课构建成知识图谱,然后学生在学的过程中不断对学生进行评价,构建一个个性化的知识图谱,例如红色表示不会,绿色表示会的,黄色表示半懂不懂。这样能够引导孩子更好的学习。我的孩子在上高中时会有一个错题本,事实上错题本正是这样一个知识图谱。
我们做的情感分析技术可以用在教育资源的评价上。例如网上有很多老师讲“C语言”,但到底哪个老师讲的好?我应该跟着哪个老师来学?网上会有一些讨论,根据对这些讨论中的情感分析,我们可以给这些课程资源进行好坏的打分。
另外我们与科大讯飞合作的工作曾经在国际权威阅读理解评测中多次夺冠。现在的阅读理解技术虽然在评测中能够取得很高的分数,但还不能做到可解释。我们希望能够做到,当一个学生在选择答案时,机器不仅能够告诉孩子他的选择是否正确,还能够告诉他为什么正确或为什么错误,即解释阅读理解中的推理过程。
另外是自动校对。我的硕士研究就是自动校对,但自动校对很难,特别是中文更加复杂。不过随着深度学习以及大数据的出现,这方面确实有很大的进展。我们希望能够把这项技术用来帮助孩子在写作文等方面起到辅助作用,例如能够自动校对语法错误等。
此外,我们也和科大讯飞合作了中文作文评阅系统:
中文作文评阅系统现在已经能够达到和人类相近的水平。我们的思路并不是机器取代人类阅卷评分,而是辅助。例如在高考中,阅卷老师会给作文打分,之后机器会快速地对已经打分的作文进行扫描并打分,如果人和机器之间的分数差别太大,再用专家进行二次审核。
我们也做了人机对话技术,这项技术在教育中的一个应用就是智能答疑系统。一个老师可以给几十万人进行授课,但却无法做到对每个人进行答疑。智能答疑系统能够自动地对用户的问题进行回答。
另外就是能够自动地生成问卷,根据用户知识点的确实自动构建覆盖其知识点的题库。以上这些是我从我自己的老本行NLP出发,给大家汇报一些潜在的应用。这些应用做出来,会帮助提高自动化,推动智能教育的革命。
对于智能教育的未来,我这里主要谈下最关键的个性化问题。
现在的教育最大的问题是陷入了盲目低效的学习困境,导致培养出的人才千人一面。有统计显示有约60%的题目训练是无效训练,要么是重复训练,要么是超出了孩子理解难度的范围。另外孩子在日常测试中有约50%的错题在期中或期末考试中还会出错,原因在于孩子认不清到底是哪个知识点出错。
举个例子。这是真实的一个案例,一名同学4月份在金属部分的测试中仅得了54分,这里红色代表他还没有掌握的知识点,绿色代表他已经掌握的知识点,黄色介于二者之间。经过个性化学习后,5月平均分达到74分,6月份便达到了96分。
现在的教学主要是对知识进行考察,但是其本质则是在考察能力。例如历史,如果问你“商鞅变法”与“王安石变法”之间的异同,这在课本里是找不到的,这里考察的包括表达能力、推理能力、创新能力等。其他也是同样。因此我们应当从以知识图谱为中心的教学方式过渡到以能力图谱为中心的教学方式中。
目前智能教育落地存在的问题包括数据壁垒,市场认识不足,学科的壁垒。应用模式上也存在一些问题,例如本来AI+教育是为了降低教师和学生负担的,但现在却反而加重了他们的负担,好比因为原来学生们都只有步枪,现在大家都配上了机枪,甚至是坦克,应用模式没有改变,反而加重了他们的负担,成为教育领域的军备竞赛。所以要回归初心,看看本报告开头关于教育本质的阐述,教育第一位使命的还是提高价值观让人能够更加幸福,切不可让人工智能技术成为应试教育的帮凶。
最后我总结一下,智能教育引导重大变革,最关键在于因材施教;国家的政策支持使智能教育的社会地位和经济价值不可估量;人工智能教育的各项技术在教育领域都有用武之地;自然语言处理技术在自然语言学习和知识学习方面将发挥重大的作用。