Spark编程基础(Python版)教材官网

厦门大学林子雨,郑海山,赖永炫编著

林子雨(ziyulin@xmu.edu.cn)

披荆斩棘,在大数据丛林中开辟学习捷径

填沟削坎,为快速学习Spark技术铺平道路

深入浅出,有效降低Spark技术学习门槛

资源全面,构建全方位一站式在线服务体系

本教材已经上市销售,可以京东、当当网购

ISBN:978-7-115-52439-3定价:49.80元人民邮电出版社

2020年4月第1版

(备注:第2版教材书稿已经提交给出版社,预计2024年6月上市销售)

本页面内容导航

扫一扫访问本网页

《Spark编程基础(Python版)》

教材简介

本书以Python作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、上机实验指南等。

作者简介

《Spark编程基础(Python版)》由林子雨、郑海山、赖永炫执笔,其中,林子雨负责教材规划、统稿、校对和在线资源创作,并撰写第1、2、3、4、5、6章的内容,郑海山负责第7章内容的撰写,赖永炫负责撰写第8章的内容。

Scala版教程

(1)在线教程

问:在线版本的《Spark入门教程》和出版发行的纸质教材《Spark编程基础(Scala版)》二者的区别是什么?

需要注意的是,在线版本中也包含了一些纸质教材中没有的内容,因为这些操作实践的内容比较琐碎,因此,没有放入纸质教材,所以,读者阅读在线版本仍然会有新的收获。总体而言,在线版本和纸质教材二者配合使用,效果更好。

(2)授课视频(Scala版)

每个章节配套实验题目和答案

纸质教材《Spark编程基础(Python版)》的每个章节(除了第3章Spark的设计与运行原理)末尾都配套了学生上机实验题目,每套实验题目可以满足1次上机实验室(比如连续4节课机房统一上机实验课)的要求,旨在帮助学生更好消化理解课堂内容。下面是7个实验一览表。

本案例涉及数据预处理、消息队列发送和接收消息、数据实时处理、数据实时推送和实时展示等数据处理全流程所涉及的各种典型操作,涵盖Linux、Spark、Kafka、Flask、Flask-SocketIO、Highcharts.js、sockert.io.js、PyCharm等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例将实现一个系列程序,从厦门小鱼网爬取租房租金信息,然后利用spark的python版本进行简单分析,并利用echarts的python版本展示分析结果,此外还会简单介绍pycharm的工程建立,所以本篇将分为四个部分。

本案例采用TMDB数据集,并使用Python语言编写Spark应用程序对电影数据进行各种分析。

本实验采用Python语言,使用大数据处理框架Spark对数据进行处理分析,并对分析结果进行可视化。

本案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言,使用Spark对数据进行分析,并对分析结果进行可视化。

本案例数据集是来自Kaggle的一个跨国在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。

本案例针对全球重大地震数据进行分析,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并对结果进行数据可视化。

本案例以和鲸社区的信用卡评分模型构建数据为数据集,以Python为编程语言,使用大数据框架Spark对数据进行处理分析,并对分析结果进行可视化。

先修课程(建议学习,不是必须)

大数据课程公共服务平台

教材勘误

在教材使用过程中,如发现任何错误,欢迎联系教材作者林子雨:ziyulin@xmu.edu.cn。在此向读者表示衷心的感谢!

大事记

*2019年1月,由林子雨、郑海山、赖永炫编著的《Spark编程基础(Python版)》纸质教材书稿完成撰写,提交给人民邮电出版社出版。

*2019年11月,人民邮电出版社返回教材清样,作者进行最后校对交付给出版社,等待教材最后出版。

THE END
1.零基础学Python?这些软件是你的最佳选择!PyCharm:PyCharm是一款非常流行且强大的Python IDE,它提供了很多便利和高级的功能,比如智能代码提示、代码重构、代码调试、版本控制、项目管理等等。PyCharm有两个版本,分别是免费的社区版和付费的专业版。对于初学者来说,社区版已经足够使用了。 VS Code:VS Code是一款轻量级且跨平台的代码编辑器,它支持多种编程语言https://blog.csdn.net/m0_69824302/article/details/144384416
2.少儿编程最实用!国内外可视化在线Python编程平台推荐!编程猫是由深圳点猫科技有限公司自主研发的国内知名青少年在线编程教育平台,由独立开发的专有可视化编程工具、基于游戏的趣味编程课程体系、动态的在线社区组成。其开发的在线wood编辑器,能够实现python可视化拖拽编程。 1. 认识Wood编辑器 编程猫为各位训练师提供了Wood编辑器,支持一键云端运行,降低大家学习Python的门槛,同https://cloud.tencent.com/developer/article/1337958
3.python开发工具哪个好用?推荐几款主流好用的Python开发工具Visual Studio Code(简称VS Code)是一个免费的跨平台文本编辑器,由微软开发和维护。虽然它被称为文本编辑器,但它实际上是一个功能强大的集成开发环境(IDE),支持多种编程语言,如Python、JavaScript、C++等。 Visual Studio Code 64位 v1.94.2 官方最新安装版 https://www.jb51.net/softjc/927153.html
4.可以随时随地进行编程学习和代码练习的在线编程平台Anycodes在线编程支持包括C语言、C++、Java、Python、Golang、Matlab等在内的近30余种编程语言的在线编写与运行 网页版、手机客户端、快应用、小程序;编程学习、代码练习;Anycodes可以充分利用学习者的零散时间进行综合能力的提升 源于社区,回馈社会;将小众平台打造成大众品牌,项目团队来自国防科大、浙江大学等高效以及腾讯https://www.anycodes.cn/
5.WelcometoPython.orgThe official home of the Python Programming Languagehttps://www.python.org/
6.Python编程实战妙趣横生的项目之旅《Python编程实战:妙趣横生的项目之旅》基于Python语言,通过项目展示Python的奇妙应用,适合Python初学者学习。在本书中,你将使用Python编程语言模拟探索火星、木星以及银河系最遥远的地方,体验诗人的意境,了解高级的金融知识等。你还会学到各种各样的技术,如马尔可夫链分析技术、蒙特卡罗模拟、图像叠加技术、基因遗传算法等https://labs.epubit.com/bookDetails?id=UB77b8974a26924
7.在线编程Python123文本输出环境支持 math, random, re, datetime, csv 等大多数 Python 标准库,可通过用户反馈告诉我们您需要的模块 文本输出环境用户代码执行限制通常为 1秒 和 256 MiB 内存以内, 会根据服务器负载动态调整 快捷键: 补全代码: Alt + Enter 运行代码 Ctrl + Enter运行https://www.python123.io/index/playground/python?ivk_sa=1025845k
8.CodeCombat扣哒世界是教育部白名单赛事平台,信奥CSP-J/S学习平台,AI世青赛、图灵计划和Code Quest官方竞赛平台,支持Python, C++, JavaScript。https://il.codecombat.com/
9.python网页在线编程并运行python网页运行python网页在线编程并运行 python 网页运行 Python学习(四) ———自动化启动运行第一个网页 web自动化环境搭建(python+selenium+webdriver) 一、 准备 浏览器:Chrome 系统环境:Win10 编译工具:Pycharm 自动化工具为:selenium+webdriver 1.1安装pip工具 1.打开cmd,输入:pip,出现如下图界面,说明pip环境OK.https://blog.51cto.com/u_16213711/8214652
10.STEM86在线编程环境免除繁琐安装配置自带图形化Python编程,方便初学者使用。https://python.stem86.com/
11.常用的python编程软件开发工具有哪些?如今,随着各行各业都在数字化转型,AI前所未有的发展态势在各个领域长驱直入,它在给人类带来前所未有的便利和效率的同时也使人类面临前所未有的挑战,所以AI人才也必将走出互联网和IT行业,成为更多行业需求的技术岗位,因此,学好Python编程,将会有一个很不错的发展前景。 https://www.bwie.com/jsgh/23.html
12.NCT青少年编程能力等级测试NCT青少年编程能力等级测试由国家民政部首批AAA级行业组织中国软件行业协会主办,基于全国信标委组织研制、清华大学领衔起草的《青少年编程能力等级》标准推出,考试平台、考试方案、真题试卷连续多年通过教育部教育信息化技术标准委员会CELTSC标准符合性认证。NCT青少年编程能力等级测试考试科目涵盖青少年图形化编程 (1-3级,Scrathttps://www.nct-test.com/
13.《中学生可以这样学Python》(董付国应根球)简介书评当当网图书频道在线销售正版《中学生可以这样学Python》,作者:董付国、应根球,出版社:清华大学出版社。最新《中学生可以这样学Python》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《中学生可以这样学Python》,就上当当网。http://product.dangdang.com/25183060.html
14.Python网页版运行器5. W3Schools:提供了一个Python在线编译器,用户可以在浏览器中编辑Python代码,并查看运行结果。 6. pythontutor:这是一个重点推荐的在线工具,它不仅支持Python代码的在线运行,还提供了代码执行的可视化展示,帮助用户理解代码的执行过程。 这些在线工具非常适合初学者学习和实践Python编程,也适合开发者在没有安装Python环https://www.colostar.cn/links/8870.html