林子雨报告全文:大数据处理技术Spark课程资源和教学经验分享

第2届全国高校大数据教学研讨会大会特邀报告

扫一扫访问本网页

【关键词】高校;大数据;课程;教学;公共服务体系;Spark;大数据技术原理与应用

尊敬的各位来宾,大家上午好!

很荣幸,作为大会东道主为大会献上最后一个特邀报告。今天的报告里,我将首先介绍一下我们厦门大学数据库实验室团队历时五年建设的“高校大数据课程公共服务平台”,其次,简要介绍厦门大学已经建设完成的大数据课程体系,然后,简要介绍Spark课程的先修课程《大数据技术原理与应用》的课程资源,最后,重点介绍《Spark编程基础》课程资源与教学经验。

一、高校大数据课程公共服务平台

高校大数据课程公共服务平台的亮点工作包括以下几个方面:

二、厦门大学建设的大数据课程体系

从2013年开始,经过为期五年的建设,厦门大学已经建成了涵盖入门课程、进阶课程和实习实训在内的大数据课程体系,可以为全国高校提供包括教材、讲义PPT、习题、案例、视频、师资培训等全方位的大数据课程服务。

案例1:基于SparkMLlib电影推荐实验案例案例2:Sqoop+Hive+HBase+MR+R某技术论坛日志分析项目案例案例3:Kafka+Spark+Redis+R实时分布式日志流处理案例案例4:HDFS+Spark+MySQL+JSP用户行为分析案例案例5:点击流日志分析实验案例

图厦门大学林子雨老师团队建设的大数据课程体系

三、先修课程《大数据技术原理与应用》

《大数据技术原理与应用》是《Spark编程基础》的先修课程。下面,我将从课程定位、教材选择、课时安排、实验内容、考核方法、课程资源等方面,介绍《大数据技术原理与应用》课程的建设方法和经验。

(一)课程定位

(二)教材选择

(三)课时安排

课程共16周,每周2学时,总计32学时(理论32学时,可以另外安排16个实验上机学时)。

(四)实验内容

1.上机实验指南

实验一:熟悉常用的Linux操作和Hadoop操作

实验二:熟悉常用的HDFS操作

实验三:熟悉常用的HBase操作

实验四:NoSQL和关系数据库的操作比较

实验五:MapReduce初级编程实践

2.综合实验案例

(五)考核方法

(六)课程资源

四、《Spark编程基础》课程资源与教学经验

1.编程语言的选择

选择教材时,必须首先确定编程语言。Spark支持多种编程语言:Scala、Java、Python、R。Spark首选语言是Scala,可以把Python作为课程拓展学习。

Spark这个软件本身就是使用Scala语言开发的,采用Scala语言编写Spark应用程序,可以获得最好的性能。关于采用哪种语言编写Spark应用程序,这里强调两点:

(1)Java代码太繁琐。在大数据应用场景中,不太适合使用Java,因为,完成同样的任务,Scala只需要一行代码,而Java则可能需要10行代码;而且,Scala语言可以支持交互式编程,大大提高了程序开发效率,而Java则不支持交互式执行,必须编译以后运行。

(2)Python语言并发性能不好。在并发性能方面,Scala要明显优于Python,而且,Scala是静态类型,可以在编译阶段就抛出错误,便于开发大型大数据项目,此外,Scala兼容Java,运行在JVM上,可以直接使用Java中的HadoopAPI来和Hadoop进行交互,但是,Python与Hadoop之间的交互非常糟糕,通常都需要第三方库(比如hadoopy)。

2.纸质教材

披荆斩棘,在大数据丛林中开辟学习捷径

填沟削坎,为快速学习Spark技术铺平道路

深入浅出,有效降低Spark技术学习门槛

资源全面,构建全方位一站式在线服务体系

本书以Scala作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、SparkMLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、授课视频、上机实验指南等。

3.免费在线教程

课程共16周,每周2学时,总计32学时理论课程。各高校可根据实际情况,再额外增加16学时实验上机。

(四)交叉知识

本课程涵盖知识内容包括:操作系统(Linux)、分布式存储(HDFS、HBase)、分布式计算(SparkCore)、流计算(SparkStreaming)、机器学习(SparkMLlib)、查询分析(SparkSQL)、日志采集(Flume)、消息分发(Kafka)、数据仓库(Hive)、关系数据库(MySQL)、机器学习/数据挖掘等知识。同时要掌握开发工具Eclipse、IntelliJIDEA以及编译打包工具sbt和Maven等。

图《Spark编程基础》教材中涉及的交叉知识

(五)实验内容

1.上机环境搭建

2.上机实验指南

实验1-Linux系统的安装和常用命令

实验2-Scala编程初级实践

实验3-Spark和Hadoop的安装

实验4-RDD编程初级实践

实验5-SparkSQL编程初级实践

实验6-SparkStreaming编程初级实践

实验7-Spark机器学习库MLlib编程实践

(七)授课视频

(八)师资培训

结束语

厦门大学数据库实验室在过去四年投入大量精力建设了丰富的大数据课程资源,总体而言,我们的课程建设模式如下:以大量教学实践推动课程和教材建设、以平台思维促进教学资源汇聚和共享、以迭代方法不断优化升级教学内容、自我造血为课程建设提供稳定资金保障。

最后,衷心感谢各位来宾对本次会议的大力支持,让我们共同努力,一起助力中国高校大数据教学事业不断迈上新的台阶。谢谢大家!

THE END
1.线上教育平台搭建(H5快速搭建APP)线上教育平台搭建(h5、快速搭建、app),线上教育搭建模式玩法,yixun-apr168,线上教育搭建商城app开发 零基础搭建在线教育网校平台的三种方式:自己开发程序、购买现成的程序或入驻第三方平台。 1、自己开发搭建的优点在于可以量身定制。根据自身特点进行功能等搭建。如果教育机构自己组建技术团队开发程序,无疑能大的满足自https://product.11467.com/info/13929954.htm
2.机构如何搭建一个在线课程教学平台?在线教育平台的业务流程是什么随着数字化教育的兴起,越来越多的教育机构开始考虑建立自己的在线课程教学平台。这一趋势不仅顺应了时代的发展,而且为教育行业带来了诸多便利和优势。构建一个在线教学平台可以帮助机构拓宽服务范围、提升教学质量、增强学生体验,并且能够有效地管理教育资源。那么,机构应如何搭建一个功能全面、操作简便的在线课程教学平台呢https://blog.csdn.net/2201_76041826/article/details/136024662
3.在线教学云平台在线教学云平台线上教育平台系统怎么制作,在线在线教学云平台在线教育系统:制作简单,管理高效 在线教学云平台在线教育系统,支持一键套用现成的模板来搭建您的在线教育小程序系统,提供到的所有模板都是免费的哦。 操作教程 (一)模板入口 1、在管理后台鼠标移动到【装修店铺】位置,选择【移动端】进入设计页面。 http://www.91jinteng.com/h-nd-357.html
4.blackboard教学平台(精选8篇)同时,该平台的调查统计功能(主要包括测试管理、调查管理、课程统计等模块)不仅能够反映每一位登录平台的用户访问的时间、访问的内容等信息,还可以自动反馈学生的练习结果,真正实现及时动态的在线辅助教学作用。 很显然,bb平台的总体特征是开放性,即在提供基本的可执行工具模块后,具体课程内容及显示模块都可以由课程负责https://www.360wenmi.com/f/fileyz179ocp.html
5.服务器平台搭建腾讯云开发者社区努力在转型,若您正巧是其中的一份子,却又不知道从何做起,那不妨从了解在线教育平台搭建的具体步骤开始hadoop入门教程之DKH安装环境准备 前几天去参加了一个线下的聚会,参加聚会的基本都是从事互联网工作的校园版网络教学平台搭建方案(学生端) 随着在线教育的发展,很多学校也开始考虑接入内网完善网络教学平台搭建https://cloud.tencent.com/developer/information/%E6%9C%8D%E5%8A%A1%E5%99%A8%E5%B9%B3%E5%8F%B0%E6%90%AD%E5%BB%BA
6.菜鸟教程菜鸟教程(www.runoob.com)提供了编程的基础技术教程, 介绍了HTML、CSS、Javascript、Python,Java,Ruby,C,PHP , MySQL等各种编程语言的基础知识。 同时本站中也提供了大量的在线实例,通过实例,您可以更好的学习编程。..https://www.runoob.com/
7.网站搭建学习网学做网站学习网站制作学习搭建网站源码网网站搭建学习网,学做网站,学习网站制作,学习搭建网站,源码网,网站搭建教学网,专注于网站技术教学和优质源码资源分享,教你搭建各种网站,你想搭建的这里都可以有!技术教学和精品优质资源的集中营,致力于打造成为知名的网站技术教学知识分享、交流、学习的生态圈。https://www.xuezuoweb.com/
8.公众号网课怎么弄,看教学视频需要付费功能搭建教程如题,我们今天来说一下公众号网课怎么弄,所谓公众号网课就是通过微信公众号开发一个在线教学的平台,以直播或者录播的形式向学生教学,当然可以设置免费课程或者付费课程,包括下载一些课件的功能等等。 一、准备好微信公众号,且开通了微信支付。 二、申请一个微人家的帐号,网址是www.weixrj.com https://www.weixinrj.com/news/1288.html
9.融课云学院网络教学软件通知公告 1.11:10测试 发酒疯积分姐姐的房间都叫房东家 2023-11-03 00:00http://2022.weisha100.net/
10.大数据技术基础及应用教程(Linux+Hadoop+Spark)——井超樊永生配套资源:教学PPT、程序源代码、集群虚拟机、扩展学习视频、课后练习题及答案。 本书特色: 系统介绍大数据三大核心技术(Linux、Hadoop、Spark)原理及其应用。 实例讲解典型大数据应用:构建基于分布式集群的大数据平台及离线/在线数据分析。 本书教学资源,样书可添加小编微信13146070618索取 本书从大数据技术相关概念出发,系统http://m.cmpedu.com/books/book/5605771.htm
11.悦卷通成绩查询学生版悦卷通官方查成绩app下载v2.6.7为各联考、资源厂商和机构等搭建个性化网阅平台,提供定制化服务。 2、【功能强大】 可同时支撑区域内期中期末统考和平时的校内考试。 3、【同步阅卷】 支持多个教师同时在线阅卷,阅卷进度实时监控。 4、【使用教程】 提供完整的服务和培训体系,保证客户高效方便的使用网阅系统。 软件特色 1、【教学大数据】 持续存储https://www.qimu86.com/soft/90232.html
12.特教工作计划8篇(二)、教程编写团队搭建 1、以各教研室主任为核心,推举选拔优秀人才,成立教程编写小组。 2、轮流负责制,对教务各方面工作实行轮流负责制,例如在检查各部门教学计划,实行轮流检查。 (三)教学质量管理 1、建立教学教务检查体系。任课老师定时整理和归档教学计划和教案记录,教务小组定时进行检查。对于老师或者家长反馈有https://www.unjs.com/fanwenwang/gzjh/20210913145520_4142948.html
13.Python学习网Python编程语言学习、交流、培训平台,包含最新Python3基础教程、视频教程、技术动态及下载资源推荐等,欢迎自学!https://www.py.cn/
14.道一云七巧企业直播培训操作教程 道一云大学提供完善的直播培训功能,帮助企业实现数字化培训场景。接下来,我们从管理员、讲师、学员等角色快速了解下直播培训的使用方法,简单低门槛,一学就会。 ▎管理员创建直播 ?在管理后台打开「在线培训」模块下的「直播管理」入口,点击「新建直播」; https://wbg.do1.com.cn/xueyuan/17823.html
15.初中计算机课程11篇(全文)2. 改进教学方法, 建立现代化的教学平台 教学方法是为了完成教学任务而采用的方法, 它关系到教学活动的有效性。目前, 对初中计算机基础课程教学方法的要求越来越高, 传统的“黑板+粉笔”的教学模式已不适应时代发展的要求。为了更有效的实施教学, 使教学最优化, 在选择教学方法时, 应考虑多种方法的结合。教学方法https://www.99xueshu.com/w/ikey9mymdl5m.html
16.淘宝运营培训淘宝运营培训课程视频教程系统教学领淘教育是一家专业的淘宝运营培训机构教学平台、提供系统全面的淘宝运营培训全套教程视频课程实战干货、淘宝卖家免费学习网站!https://www.lingtaoedu.com/
17.Python数据可视化案例教程全套教学课件.pptxPython数据可视化案例教程全套教学课件.pptx,Python 数据可视化案例教程 全套可编辑PPT课件 全课导航 项目1 搭建数据可视化开发平台 知识目标 理解数据可视化的概念和流程。 了解数据可视化的应用场景、设计原则和常用图表。 了解常用的数据可视化工具。 技能目标 能在Windohttps://max.book118.com/html/2024/0517/5314300242011211.shtm