Spark编程基础(Python版)教材官网

厦门大学林子雨,郑海山,赖永炫编著

林子雨(ziyulin@xmu.edu.cn)

披荆斩棘,在大数据丛林中开辟学习捷径

填沟削坎,为快速学习Spark技术铺平道路

深入浅出,有效降低Spark技术学习门槛

资源全面,构建全方位一站式在线服务体系

本教材已经上市销售,可以京东、当当网购

ISBN:978-7-115-52439-3定价:49.80元人民邮电出版社

2020年4月第1版

(备注:第2版教材书稿已经提交给出版社,预计2024年6月上市销售)

本页面内容导航

扫一扫访问本网页

《Spark编程基础(Python版)》

教材简介

本书以Python作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。本书每个章节都安排了入门级的编程实践操作,以便读者更好地学习和掌握Spark编程方法。本书官网免费提供了全套的在线教学资源,包括讲义PPT、习题、源代码、软件、数据集、上机实验指南等。

作者简介

《Spark编程基础(Python版)》由林子雨、郑海山、赖永炫执笔,其中,林子雨负责教材规划、统稿、校对和在线资源创作,并撰写第1、2、3、4、5、6章的内容,郑海山负责第7章内容的撰写,赖永炫负责撰写第8章的内容。

Scala版教程

(1)在线教程

问:在线版本的《Spark入门教程》和出版发行的纸质教材《Spark编程基础(Scala版)》二者的区别是什么?

需要注意的是,在线版本中也包含了一些纸质教材中没有的内容,因为这些操作实践的内容比较琐碎,因此,没有放入纸质教材,所以,读者阅读在线版本仍然会有新的收获。总体而言,在线版本和纸质教材二者配合使用,效果更好。

(2)授课视频(Scala版)

每个章节配套实验题目和答案

纸质教材《Spark编程基础(Python版)》的每个章节(除了第3章Spark的设计与运行原理)末尾都配套了学生上机实验题目,每套实验题目可以满足1次上机实验室(比如连续4节课机房统一上机实验课)的要求,旨在帮助学生更好消化理解课堂内容。下面是7个实验一览表。

本案例涉及数据预处理、消息队列发送和接收消息、数据实时处理、数据实时推送和实时展示等数据处理全流程所涉及的各种典型操作,涵盖Linux、Spark、Kafka、Flask、Flask-SocketIO、Highcharts.js、sockert.io.js、PyCharm等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。案例适合高校(高职)大数据教学,可以作为学生学习大数据课程后的综合实践案例。通过本案例,将有助于学生综合运用大数据课程知识以及各种工具软件,实现数据全流程操作。各个高校可以根据自己教学实际需求,对本案例进行补充完善。

本案例将实现一个系列程序,从厦门小鱼网爬取租房租金信息,然后利用spark的python版本进行简单分析,并利用echarts的python版本展示分析结果,此外还会简单介绍pycharm的工程建立,所以本篇将分为四个部分。

本案例采用TMDB数据集,并使用Python语言编写Spark应用程序对电影数据进行各种分析。

本实验采用Python语言,使用大数据处理框架Spark对数据进行处理分析,并对分析结果进行可视化。

本案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言,使用Spark对数据进行分析,并对分析结果进行可视化。

本案例数据集是来自Kaggle的一个跨国在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。

本案例针对全球重大地震数据进行分析,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并对结果进行数据可视化。

本案例以和鲸社区的信用卡评分模型构建数据为数据集,以Python为编程语言,使用大数据框架Spark对数据进行处理分析,并对分析结果进行可视化。

先修课程(建议学习,不是必须)

大数据课程公共服务平台

教材勘误

在教材使用过程中,如发现任何错误,欢迎联系教材作者林子雨:ziyulin@xmu.edu.cn。在此向读者表示衷心的感谢!

大事记

*2019年1月,由林子雨、郑海山、赖永炫编著的《Spark编程基础(Python版)》纸质教材书稿完成撰写,提交给人民邮电出版社出版。

*2019年11月,人民邮电出版社返回教材清样,作者进行最后校对交付给出版社,等待教材最后出版。

THE END
1.Python学习资料Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。 Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。 http://www.n6game.cn/
2.python学习网python学习资料python学习网汇集大量的python学习方法,python学习技巧,python学习心得等,为需要学习python的学员提供大量有价值的信息,欢迎您访问python学习网。https://www.qinxue365.com/xxzx/python/
3.Python学习资料Python教程Python学习资料 官方网站 : www.python.org Python is an interpreted, interactive, object-oriented programming language. It is often compared to Tcl, Perl, Scheme or Java. Python combines remarkable power with very clear syntax. It has modules, classes, exceptions, very high level dynamic data https://www.php.cn/faq/227784.html
4.Python学习资料参考资料 ZDNET文章:学习Python语言必备的资源 Pythonic Web 应用平台对比现在个人对web.py(大致和KARRIGELL类似,都是类似与PHP那样比较简单的Python Web应用框架)和web2py非常感兴趣。 在wxPython下进行图像处理的经验(其实,仅使用wxPython也可以完成很多比较基础的图像处理工作,具体可以参照《wxPython in Action》一书的第https://www.360doc.cn/mip/9725467.html
5.Python学习资料与博客推荐Python学习资料与博客推荐 知乎上看到一题主询问: ”已经学习了python的入门书籍,也练习了书上的一些习题,练习写了一个20行左右的爬图片的小程序。现在想要提高提高,就想问问能有哪些好的网站或者博客有这方面的资料。“ Python程序员彭泉鑫翻译了Full Stack Python上的一段内容,并进行了调整,希望对初学Python、https://www.imooc.com/article/1451
6.整理的一些Python学习资料一张图看懂python.JPG 其实Python可以开发的东西很多啊,什么Java啊、C啊可以开发的,Python同样也可以,所以貌似总结出来也没什么意义,不过反正也没事,权当整理一份Python学习资料吧~ 一、Python可以做的事 1、Python可以开发诸如:聊天室、博客、计算器…之类,我们在学校一开发就必定想到的一些小应用; https://www.jianshu.com/p/e9bb36a5d63f
7.8.3.Python学习资料附录《Python最佳实践指南201820188.3. Python 学习资料 新手 The Python Tutorial 这个是官方教程。它包含了所有的基础,并提供了一个关于语言和标准库的教程。推荐给那些需要一份关于这门语言的快速开始指南的人们。 The Python Tutorial Python for Beginners thepythonguru.com 是一个专注于新手程序员的教程网站。它涵盖了许多深度的 Python 概念。https://learnku.com/docs/python-guide/2018/intro-learning/3290
8.史上最全的Python学习资料PDF电子书大合集(703.6MB)史上最全的Python学习资料 PDF电子书 大合集703.6MB 面向对象的思考过程.pdf3.3MB 码农第1期.pdf8.9MB 码农 第8期.pdf8.7MB 码农 第7期.pdf19.6MB 码农 第6期.pdf13.1MB 码农 第5期.pdf13.7MB 集体智慧编程-python算法应用.pdf27.9MB 常用的正则表达式总结.txt2KB https://www.iizhi.cn/resource/detail/ee167cf0451d12fa56926dceb31f6864
9.Python入门教程完整版(懂中文就能学会)pdf版+源码(讲义/笔记)电子书Python客栈 广告 商业广告,理性选择 ↑ 回复“小白”获取必备资料 软件问题没解决?试试这里 零距离AI可以帮你高效完成AI问答、AI对话、提供软件相关教程以及解决生活中遇到的各种疑难杂症,还能帮助你进行AI写作、AI绘画等等,提高你的工作学习效率。 我要提问 https://www.jb51.net/books/672756.html
10.Python:死磕这五本书,带你从基础到进阶!python书籍推荐Python入门-进阶学习资料 如果你也想自学Python,可以关注我。我会把踩过的坑分享给你,让你不要踩坑,提高学习速度,还整理出了一套系统的学习路线,这套资料涵盖了诸多学习内容:开发工具,基础视频教程,项目实战源码,51本电子书籍,100道练习题等。相信可以帮助大家在最短的时间内,能达到事半功倍效果,用来复习也是非常https://blog.csdn.net/2301_78150559/article/details/141265264
11.Python初学者(零基础学习PythonPython入门)书籍视频资料本文主要针对零基础想学习Python者。本文本文由@史江歌(shijiangge@gmail.comQQ:499065469)根据互联网资料收集整理而成,感谢互联网,感谢各位的分享。鸣谢!本文会不断更新。 一、学会使用搜索引擎,尤其是Google。推荐阅读文章 《如何用好Google搜索引擎?》知乎问答@崔凯 https://github.com/Yixiaohan/codeparkshare
12.Python2教程下载:https://www.python.org/downloads/ 教程:http://www.w3cschool.cn/python/python-tutorial.html 领取免费资料 扫描下方二维码或打开微信搜一搜“w3cschool编程狮”关注公众号回复关键词【Python123】或者【Python资料包】免费领取 Python 学习资料,包含软件安装包,思维导图等 多端阅读https://www.w3cschool.cn/python
13.图书Python中文自然语言处理基础与实战本课程是图书《Python中文自然语言处理基础与实战》的配套学习视频,全书共12章,内容包括自然语言处理的概述、基本流程、开发环境,语料库、正则表达式、中文分词、词性标注与命名实体识别、关键词提取、文本向量化、文本分类与聚类、文本情感分析、自然语言处理中的深度学习、智能问答系统等技术,以及如何使用TipDM数据挖掘建模https://edu.tipdm.org/course/6692
14.Python学习网Python编程语言学习、交流、培训平台,包含最新Python3基础教程、视频教程、技术动态及下载资源推荐等,欢迎自学!https://www.py.cn/
15.用Python进行数据分析,不懂Python,求合适的Python书籍或资料我收集了一些python学习书籍 大家感兴趣的话可以关注我的公众号:pydatas,回复:python,会把python资料https://www.zhihu.com/question/24526559/answer/698306074
16.WelcometoPython.orgThe official home of the Python Programming Languagehttps://www.python.org/