林子雨报告全文:大数据处理技术Spark课程资源和教学经验分享

第2届全国高校大数据教学研讨会大会特邀报告

扫一扫访问本网页

【关键词】高校;大数据;课程;教学;公共服务体系;Spark;大数据技术原理与应用

尊敬的各位来宾,大家上午好!

很荣幸,作为大会东道主为大会献上最后一个特邀报告。今天的报告里,我将首先介绍一下我们厦门大学数据库实验室团队历时五年建设的“高校大数据课程公共服务平台”,其次,简要介绍厦门大学已经建设完成的大数据课程体系,然后,简要介绍Spark课程的先修课程《大数据技术原理与应用》的课程资源,最后,重点介绍《Spark编程基础》课程资源与教学经验。

一、高校大数据课程公共服务平台

高校大数据课程公共服务平台的亮点工作包括以下几个方面:

二、厦门大学建设的大数据课程体系

从2013年开始,经过为期五年的建设,厦门大学已经建成了涵盖入门课程、进阶课程和实习实训在内的大数据课程体系,可以为全国高校提供包括教材、讲义PPT、习题、案例、视频、师资培训等全方位的大数据课程服务。

案例1:基于SparkMLlib电影推荐实验案例案例2:Sqoop+Hive+HBase+MR+R某技术论坛日志分析项目案例案例3:Kafka+Spark+Redis+R实时分布式日志流处理案例案例4:HDFS+Spark+MySQL+JSP用户行为分析案例案例5:点击流日志分析实验案例

图厦门大学林子雨老师团队建设的大数据课程体系

三、先修课程《大数据技术原理与应用》

《大数据技术原理与应用》是《Spark编程基础》的先修课程。下面,我将从课程定位、教材选择、课时安排、实验内容、考核方法、课程资源等方面,介绍《大数据技术原理与应用》课程的建设方法和经验。

(一)课程定位

(二)教材选择

(三)课时安排

课程共16周,每周2学时,总计32学时(理论32学时,可以另外安排16个实验上机学时)。

(四)实验内容

1.上机实验指南

实验一:熟悉常用的Linux操作和Hadoop操作

实验二:熟悉常用的HDFS操作

实验三:熟悉常用的HBase操作

实验四:NoSQL和关系数据库的操作比较

实验五:MapReduce初级编程实践

2.综合实验案例

(五)考核方法

(六)课程资源

四、《Spark编程基础》课程资源与教学经验

1.编程语言的选择

选择教材时,必须首先确定编程语言。Spark支持多种编程语言:Scala、Java、Python、R。Spark首选语言是Scala,可以把Python作为课程拓展学习。

Spark这个软件本身就是使用Scala语言开发的,采用Scala语言编写Spark应用程序,可以获得最好的性能。关于采用哪种语言编写Spark应用程序,这里强调两点:

(1)Java代码太繁琐。在大数据应用场景中,不太适合使用Java,因为,完成同样的任务,Scala只需要一行代码,而Java则可能需要10行代码;而且,Scala语言可以支持交互式编程,大大提高了程序开发效率,而Java则不支持交互式执行,必须编译以后运行。

(2)Python语言并发性能不好。在并发性能方面,Scala要明显优于Python,而且,Scala是静态类型,可以在编译阶段就抛出错误,便于开发大型大数据项目,此外,Scala兼容Java,运行在JVM上,可以直接使用Java中的HadoopAPI来和Hadoop进行交互,但是,Python与Hadoop之间的交互非常糟糕,通常都需要第三方库(比如hadoopy)。

2.纸质教材

披荆斩棘,在大数据丛林中开辟学习捷径

填沟削坎,为快速学习Spark技术铺平道路

深入浅出,有效降低Spark技术学习门槛

资源全面,构建全方位一站式在线服务体系

本书以Scala作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、SparkMLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、授课视频、上机实验指南等。

3.免费在线教程

课程共16周,每周2学时,总计32学时理论课程。各高校可根据实际情况,再额外增加16学时实验上机。

(四)交叉知识

本课程涵盖知识内容包括:操作系统(Linux)、分布式存储(HDFS、HBase)、分布式计算(SparkCore)、流计算(SparkStreaming)、机器学习(SparkMLlib)、查询分析(SparkSQL)、日志采集(Flume)、消息分发(Kafka)、数据仓库(Hive)、关系数据库(MySQL)、机器学习/数据挖掘等知识。同时要掌握开发工具Eclipse、IntelliJIDEA以及编译打包工具sbt和Maven等。

图《Spark编程基础》教材中涉及的交叉知识

(五)实验内容

1.上机环境搭建

2.上机实验指南

实验1-Linux系统的安装和常用命令

实验2-Scala编程初级实践

实验3-Spark和Hadoop的安装

实验4-RDD编程初级实践

实验5-SparkSQL编程初级实践

实验6-SparkStreaming编程初级实践

实验7-Spark机器学习库MLlib编程实践

(七)授课视频

(八)师资培训

结束语

厦门大学数据库实验室在过去四年投入大量精力建设了丰富的大数据课程资源,总体而言,我们的课程建设模式如下:以大量教学实践推动课程和教材建设、以平台思维促进教学资源汇聚和共享、以迭代方法不断优化升级教学内容、自我造血为课程建设提供稳定资金保障。

最后,衷心感谢各位来宾对本次会议的大力支持,让我们共同努力,一起助力中国高校大数据教学事业不断迈上新的台阶。谢谢大家!

THE END
1.在线讲课软件免费能讲课的软件教师免费讲课的软件在线讲课软件,许多想要提升自己知识水平的朋友都会选择在线授课软件,在线讲课软件页面中提供的软件都拥有专业名师在线授课,每https://www.duote.com/zt/zaixiankt/
2.线上教学方案(合集15篇)充分发挥“互联网+教育”的作用,统筹利用各类教育资源公共服务平台和直播平台,整合调集适配的教育教学资源,充分利用超星等线上教学平台实施在线授课(听课)、资源点播和线上辅导、讨论、答疑等活动,消减疫情对教学活动的影响,有效实现“不停教、不停学”,确保疫情防控期间在线教学活动科学有序、高效开展。https://www.wenshubang.com/fangan/2969132.html
3.到Lazada开店品牌开启东南亚市场免佣金 参加LazCoin 店铺运营 智能诊断 跨境立体 物流解决方案 第三方服务商 推荐 官方直播课程 知识库免费开放 新商家90天佣金先缴后返,将全部返还至广告金。 品牌商家入驻专享权益 品牌商家 绿通升级LazMall 低门槛报名 早鸟项目 零门槛报名 平台包邮项目 官方1v1孵化支持 平台讲师在线授课 Lazadahttps://www.lazada-seller.cn/store
4.网络上课平台线上课堂平台网上授课平台网上授课平台_在线授课的网络平台有哪些? 网上授课平台有哪些?很多人问过我这个问题,首先,我们应该选择一个专业的在线直播教育平台,专业的直播教育平台软件具有丰富的教学功能,多种直播形式,能够满足日常教学的所有需要,更好地帮助教师完成教学任务,更好地帮助机构实现自己的转型目标。今天我们将向大家推荐很多机构都在https://www.yunduoketang.com/article/tags-487.html
5.嘉院在线平台app下载嘉院在线平台app安卓版下载v4.8疫情期间,在家学习成为了一件很重要的事情,在这次为大家大家里的嘉院在线平台是专为专门的学校打造的网课学习软件,自己的班主任和熟悉的任课老师来上课,不会出现学生们注意力不集中的问题,授课都是通过视频来进行传授的,直接和学生面对面,不受空间的局限。 https://www.crsky.com/soft/407030.html
6.在线课堂直播课堂系统在线授课软件获得场景视频助力教育机构搭建稳定安全的在线教学平台,适用于小班课,大班课,直播课堂,互动教学直播,录播点播课,为教育用户提供一站式直播解决方案https://www.bokecc.com/class/431
7.国家中小学智慧教育平台官方下载国家中小学智慧教育平台免费网课app,中小学在线教育服务平台,精选大量优质网课资源,专业教师在线授课,详细讲解各科知识,提供丰富学习资源,让孩子学习更轻松。 国家中小学智慧教育平台是什么? 一款全新推出的优质教育学习平台,里面涵盖的知识范围特别广泛,并且还有众多资历丰富的教师在线授课讲解,让用户们轻松掌握疑难点。 国https://m.qqtn.com/q/762519
8.停课不停学!高校开学首日授课平台集体“崩了”线上教育风口持续【停课不停学!高校开学首日授课平台集体“崩了” 线上教育风口持续】艾媒咨询数据显示,2018年中国在线教育用户规模超过2亿人,到2020年有望达到3亿;2018年中国在线教育市场规模超过2500亿元,2020年将超过5000亿元。(券商中国) 在东方财富看资讯行情,选东方财富证券一站式开户交易>> https://finance.eastmoney.com/a/202002181386766621.html
9.在线教育系统源码Web版丨知识付费教培授课网校平台开发丨组卷题库万岳在线教育系统源码,搭建迅速,6小时内部署完成,支持二次开发,是一款可应用于大班课、小班课、双师教学、1V1教学,并能实现多端互通的远程教育平台程序。万岳在线教育系统源码完全开源,包含丰富的运营级功能,助力教培机构快速布局线上教育市场。是众多在线教培机构的不二之选。 https://market.cloud.tencent.com/products/34293
10.CCtalk丰富多元的综合内容平台在线授课学习工具CCtalk 丰富多元的综合内容平台,为知识内容创作者、分享者提供完整的在线内容交付、变现解决方案,构建丰富多元的创作者社区和内容生态,平台覆盖考研、公考、考试考证、语言、绘画、设计、IT互联网、职场、兴趣等几十个类型的内容,让每一个热爱生活,探索未知的用户可以https://m.cctalk.com/
11.在线教育直播平台教育机构一站式服务云平台免费开通 微信平台网校 简单易用的界面, 百项实用功能+极强的稳定性 教育机构一站式服务云平台免费开通 小程序网校 课程营销、在线授课、费用支付全流搞定 教育机构一站式服务云平台免费开通 APP网校 实现碎片化网络学习,作业、测试、互动讨论 http://www.yunduozaixian.cn/
12.学校教育教学工作方案(精选18篇)针对疫情防控工作实际,充分发挥“互联网+教育”的作用,统筹利用各类教育资源公共服务平台和直播平台,整合调集适配的教育教学资源,充分利用信息化手段实施在线授课(听课)、资源点播和线上辅导、讨论、答疑等活动,消减疫情对教学活动的影响,有效实现“延迟开学不停教、不停学”,确保教育教学效果。 https://www.ruiwen.com/fangan/5149096.html
13.中公网校【中公网校】中公教育旗下在线学习培训辅导平台,通过线上线下结合、直播授课、班主任督学、题库练习等产品和服务,为用户提供教学讲练多位一体的学习体验。课程涵盖国省考、事业单位、教师、金融银行、国企、警法等公职考试。https://www.eoffcn.com/
14.网校平台哪个好?网校在线课堂app网校app下载网校app软件作为在线学习的手机平台,不仅有强大的师资力量教学,还拥有丰富的题库练习,提供不同的专业课程内容学习,覆盖领域十分广泛,打造出沉浸式的教学环境,满足不同学生的学习需求,轻松解决大家的学习问题,可谓是好用又方便,值得推荐!http://www.downcc.com/k/wangxiaoapp/
15.收藏!教育部最新公布22个免费在线课程平台(内附链接)澎湃,澎湃新闻,澎湃新闻网,新闻与思想,澎湃是植根于中国上海的时政思想类互联网平台,以最活跃的原创新闻与最冷静的思想分析为两翼,是互联网技术创新与新闻价值传承的结合体,致力于问答式新闻与新闻追踪功能的实践。https://m.thepaper.cn/newsDetail_forward_5809162
16.在线直播课堂课堂直播软件小鹅通班课为支持多人沉浸式互动的教学直播平台,可帮助老师快速创建在线直播课堂,支持实时视频互动课堂,专注提升教学品质,适用于K12、兴趣、艺术、外语、职业技能等多个教育培训行业。https://www.xiaoe-tech.com/tag/zhiboketang