Spark编程基础(Python版)教材官网

厦门大学林子雨,郑海山,赖永炫编著

林子雨(ziyulin@xmu.edu.cn)

披荆斩棘,在大数据丛林中开辟学习捷径

填沟削坎,为快速学习Spark技术铺平道路

深入浅出,有效降低Spark技术学习门槛

资源全面,构建全方位一站式在线服务体系

本教材已经上市销售,可以京东、当当网购

ISBN:978-7-115-52439-3定价:49.80元人民邮电出版社

2020年4月第1版

(备注:第2版教材书稿已经提交给出版社,预计2024年6月上市销售)

本页面内容导航

扫一扫访问本网页

《Spark编程基础(Python版)》

教材简介

本书以Python作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、上机实验指南等。

作者简介

《Spark编程基础(Python版)》由林子雨、郑海山、赖永炫执笔,其中,林子雨负责教材规划、统稿、校对和在线资源创作,并撰写第1、2、3、4、5、6章的内容,郑海山负责第7章内容的撰写,赖永炫负责撰写第8章的内容。

Scala版教程

(1)在线教程

问:在线版本的《Spark入门教程》和出版发行的纸质教材《Spark编程基础(Scala版)》二者的区别是什么?

需要注意的是,在线版本中也包含了一些纸质教材中没有的内容,因为这些操作实践的内容比较琐碎,因此,没有放入纸质教材,所以,读者阅读在线版本仍然会有新的收获。总体而言,在线版本和纸质教材二者配合使用,效果更好。

(2)授课视频(Scala版)

每个章节配套实验题目和答案

纸质教材《Spark编程基础(Python版)》的每个章节(除了第3章Spark的设计与运行原理)末尾都配套了学生上机实验题目,每套实验题目可以满足1次上机实验室(比如连续4节课机房统一上机实验课)的要求,旨在帮助学生更好消化理解课堂内容。下面是7个实验一览表。

本案例涉及数据预处理、消息队列发送和接收消息、数据实时处理、数据实时推送和实时展示等数据处理全流程所涉及的各种典型操作,涵盖Linux、Spark、Kafka、Flask、Flask-SocketIO、Highcharts.js、sockert.io.js、PyCharm等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例将实现一个系列程序,从厦门小鱼网爬取租房租金信息,然后利用spark的python版本进行简单分析,并利用echarts的python版本展示分析结果,此外还会简单介绍pycharm的工程建立,所以本篇将分为四个部分。

本案例采用TMDB数据集,并使用Python语言编写Spark应用程序对电影数据进行各种分析。

本实验采用Python语言,使用大数据处理框架Spark对数据进行处理分析,并对分析结果进行可视化。

本案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言,使用Spark对数据进行分析,并对分析结果进行可视化。

本案例数据集是来自Kaggle的一个跨国在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。

本案例针对全球重大地震数据进行分析,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并对结果进行数据可视化。

本案例以和鲸社区的信用卡评分模型构建数据为数据集,以Python为编程语言,使用大数据框架Spark对数据进行处理分析,并对分析结果进行可视化。

先修课程(建议学习,不是必须)

大数据课程公共服务平台

教材勘误

在教材使用过程中,如发现任何错误,欢迎联系教材作者林子雨:ziyulin@xmu.edu.cn。在此向读者表示衷心的感谢!

大事记

*2019年1月,由林子雨、郑海山、赖永炫编著的《Spark编程基础(Python版)》纸质教材书稿完成撰写,提交给人民邮电出版社出版。

*2019年11月,人民邮电出版社返回教材清样,作者进行最后校对交付给出版社,等待教材最后出版。

THE END
1.Python在线教程Python在线教程频道:汇集了大量精选的Python编程课程,从基础到高级、从入门到实战,有高清视频、图文教程、在线手册等,全部免费,欢迎在线学习!https://www.py.cn/course/list/96.html
2.Python编程菜鸟教程:从入门到精通的完全指南python菜鸟教程基础入门 Python安装:在官方网站下载安装包,根据不同操作系统进行安装。 Mac用户可直接使用Homebrew进行安装Windows用户需下载安装包后进行手动安装Linux用户可使用apt-get或yum进行安装基础语法:Python是一种解释型语言,支持面向对象、函数式和面向过程等多种编程范式。其语法简洁清晰,易于学习。 https://blog.csdn.net/2401_89285717/article/details/144333846
3.python2在线mob649e8154b5bf的技术博客Python2在线编程工具 在学习Python2或者需要使用Python2编写代码时,可以使用在线编程工具来快速编写和执行代码,而无需在本地安装Python2环境。下面介绍两个常用的Python2在线编程工具。 1. [Repl.it]( Repl.it是一个在线编程平台,支持多种编程语言,包括Python2。用户可以通过浏览器访问Repl.it,在线编写、运行和分享https://blog.51cto.com/u_16175435/11319077
4.Python快速编程入门(第2版).pdf黑马程序员2021年版Python快速编程入门(第2版).pdf-黑马程序员-2021年版-人民邮电出版社,本书以PyCharm为主要开发工具,采用理论与实训案例相结合的形式,系统性地讲解Python的核心知识。本书共11章,其中,第1~10章介绍Python语言的核心理论知识,包括基础知识、流程控制、字符串、组合数据https://max.book118.com/html/2021/0507/5303232144003224.shtm
5.《Python快速编程入门(第2版)》简介书评在线阅读当当木垛图书旗舰店在线销售正版《Python快速编程入门(第2版)》。最新《Python快速编程入门(第2版)》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《Python快速编程入门(第2版)》,就上当当木垛图书旗舰店。http://product.dangdang.com/1827220222.html
6.WelcometoPython.orgThe official home of the Python Programming Languagehttps://www.python.org/
7.Python编程:从入门到实践(第3版)图书介绍 在线阅读 评论57 勘误 简介 本书是享誉全球的Python入门书,影响了超过250万读者。全书分两部分:第一部分介绍用Python编程所必须了解的基本概念,包括强大的Python库和工具,以及列表、字典、if语句、类、文件和异常、代码测试等内容;第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的2D游戏、利用数据生https://www.ituring.com.cn/book/3038
8.Python编程(豆瓣)2星 0.4% 1星 0.3% 评价: 写笔记 写书评 加入购书单 分享到 推荐 内容简介· ··· 本书是一本针对所有层次的Python 读者而作的Python 入门书。全书分两部分:第一部分介绍用Python 编程所必须了解的基本概念,包括matplotlib、NumPy 和Pygal 等强大的Python 库和工具介绍,以及列表、字典、if 语句、类、文件https://book.douban.com/subject/26829016/
9.Python在线编程网站(免费的编程自学网站)2. Coding Bat 免费的在线编程站点,在上面可以集中精力进行编码,可以选择 Java 和 Python,短时间内就可以做很多的挑战,作者希望大家在学习编程的过程中,把更多的精力放在“大的编程问题”上,专注更深层次的知识,而不是都花在一些列表操作、循环等一些小的逻辑问题上。 https://qianu.com/news/253808.html
10.《Python快速编程入门(第2版)》(黑马程序员)摘要书评试读图书 > 大中专教材教辅 > 高职高专教材 > 人民邮电出版社 > Python快速编程入门(第2版) 自营 人民邮电出版社京东自营官方旗舰店 Python快速编程入门(第2版) 黑马程序员著 京东价 ¥ 促销 展开促销 配送至 --请选择-- 支持https://item.jd.com/13059394.html
11.Python3.0科学计算指南选择将Python作为其第一门编程语言的读者将在教师主导的课程中使用这本书。本书囊括了不同的主题,并提供背景阅读和实验。教师通常会依据入门课程的学习效果来选择和订购本书的材料。 已经具有编程经验以及喜欢科学计算或数学的读者,在潜心研究SciPy 和 NumPy时可以将该书作为参考资料。比如说Python中的编程与MATLAB中的https://www.epubit.com/bookDetails?id=N16459
12.Python编程从入门到实践1.python可以访问-1,-2元素,返回倒数第一、二个元素。 2.元素类型可以不一致。 3.1 列表访问和修改 1.访问和修改元素的方式和java数组一致,例如brands[0] ,需要注意,下标从0开始。 2.增加元素可以使用 方法,例如brands.append('BMW') 。 3.使用 https://www.jianshu.com/p/02769d278c0f
13.树莓派Python编程入门与实战(第2版)中文pdf扫描版[94MB]电子书下树莓派是一个只有信用卡大小的裸露电路板,它 也是一个运行开源Linux操作系统的完全可编程的PC 系统。树莓派的官方编程语言是Python,本书介绍了 在树莓派上进行Python编程的方法。 勃鲁姆/布莱斯纳罕编著的《树莓派Python编程 入门与实战(第2版)》共分7个部分。前6个部分介绍 了树莓派编程环境、Python编程基础、**https://www.jb51.net/books/633773.html
14.Python123Python 优雅胜于丑陋,简单胜于复杂,为你提供更好的 Python 学习体验。 我们相信,学习编程不在于它有多强大,而在于它能够给你怎样的力量!https://www.python123.io/index