实战数据分析:利用开源项目Superset搭建自助数据分析平台数据分析(DataAnalytics)是很多企业实

version:"3.3"services:superset:image:apache/supersetcontainer_name:supersetvolumes:-"./startup.sh:/opt/startup.sh"ports:-"8088:8088"mysql:image:mysqlcontainer_name:mysqlenvironment:MYSQL_DATABASE:"superset"MYSQL_ALLOW_EMPTY_PASSWORD:"yes"然后,在同一个目录下创建初始化脚本文件startup.sh,输入以下内容。其中,加载演示数据部分已经注释掉,需要查看演示数据的朋友可以取消注释。

#!/bin/sh#createadminaccountsupersetfabcreate-admin\--usernameadmin\--firstnameSuperset\--lastnameAdmin\--emailadmin@superset.com\--passwordadmin#upgradedatabasesupersetdbupgrade#loadexamples#supersetload_examples#setuprolessupersetinit现在我们已经创建好容器配置文件以及初始化脚本文件,就可以开始启动容器并初始化了。执行以下命令来启动容器以及初始化。

我们可以输入默认用户名密码admin/admin进入界面。

登陆进入Superset之后你会发现目前什么也没有(除非之前取消注释了加载数据)。现在我们需要进行两步操作来创建第一个数据集(Dataset)。

将鼠标悬浮在右上角的加号按钮,继续悬浮到Data,然后点击Connectdatabase。

出现弹窗后,选择MySQL,并输入数据库连接信息,如下图。然后点击Connect,继续点击Finish完成数据库连接。

为了在Superset上尽快体验交互式数据分析,我们将选择上传一个Excel数据文件到Superset。

不过在此之前,我们需要多做一步,即在MySQL中允许上传文件。这个可以通过Superset界面进行设置。操作如下。

好了,现在我们可以上传Excel文件了!

在右上角点击Uploadfiletodatabase然后点击UploadExcelfile。

然后,在上传Excel页面中,选择要上传的文件,输入表名为sales,点击下方的Save按钮,即可创建数据集。

上传Excel数据文件完毕后,你可以在Datasets中看到已经创建好的数据集。

接下来我们来看看如何在Superset中分析该数据。

点击刚才创建好的sales数据集,进入到分析页面。如果你对PowerBI或者Tableau熟悉的话,你会发现这其实就是PowerBI的Visual,或Tableau中的Chart。其最左侧是数据集的各个字段,旁边是数据操作区域,右侧是图标展示区域。

现在,我们想看看按季度的销售额是多少。将左侧的SALES拖到METRICS,并选择SUM;然后将YEAR_ID和QTR_ID拖到DIMENSIONS;再点CREATECHART。我们可以看到如下统计表格。

从上图可以看到,销售额(Sales)似乎受季节性影响:每个冬季,也就是第四季度会有大量的销售额。这是因为,欧美国家会在圣诞节期间大量采购节日礼品以及物资,形成较高的销售额。因此,这个发现也不意外。

以上,我们通过鼠标操作几下,就创建了两个简单的图表,从而完成了简单的可视化数据分析。Superset虽然功能上还不及商业软件PowerBI和Tableau,但这对于咱们白嫖玩家来说已经完全够用!

THE END
1.(持续更新)数据分析实战项目100+例王小王123的博客以数据分析实战项目为主,包含大数据分析案例、机器学习项目、数据分析项目、预处理、可视化、数据库等实际应用项目、其中项目来源于:毕设选题、课程设计、业务需求、专业辅导1V1项目、日常接单、专业书籍案例项目等,项目来源于生活。旨在大量的实战,快速上手并应用于工作开发,为工作提供大量经验! 关注https://blog.csdn.net/weixin_47723732/category_12180011.html
2.熬夜整理出20个免费又实用的数据源网站!再也不愁找不到数据练手可要做项目,首先得有数据,要上哪去找数据来练手? 大家也都知道,平时我做数据分析实战时都会把数据集发给大家练习,但毕竟我精力有限,不能一直给大家提供数据集,所以今天老李给大家整理了20个我平常做数据分析、数据挖掘练习的时候经常用到的数据集网站,对急需数据练手的朋友非常有用。 https://blog.itpub.net/21472864/viewspace-2840739/
3.优途UX教育怎么样?2023年课程介绍,深圳UX+UI设计培训机构我们课程结构的差异在于以用户体验、交互设计、UI界面设计为核心,深入讲解互联网大厂研发全流程,从用户体验设计、用户研究、场景分析、痛点分析、用户画像、数据分析、竞品分析、产品定位、业务流程图、产品信息架构、产品原型、DRD文档、UI规范、UI组件搭建、UI界面设计和开发对接、项目提案等多个真实项目环节进行教学,不https://www.yoojia.com/ask/17-11562387145828738598.html
4.2024年招投标数据分析与实战实训心得3篇.docx师资质要求2.3项目经理职责与权限2.4实战实训导师职责与要求3.1项目进度安排与节点3.2数据收集与整理流程3.3数据分析方法培训与实操3.4实战实训任务分配与执行4.1数据来源与处理规范4.2数据安全与保密措施4.3数据分析工具与软件使用4.4数据质量监控与评估5.1实战实训案例选择与准备5.2案例分析与讨论5.3案例解决方案设计5.4案例实施https://www.renrendoc.com/paper/370473976.html
5.Python数据分析优秀案例&项目经历总之,本次项目干货满满,除了通过绘图等常规手段之外,也用到了t检验等假设检验的方法来力求让结论更具说服力。 下面开始项目的正式介绍。 目录 前言 1.项目介绍 1.1 项目介绍 1.2 数据介绍 2. 数据整理 3. 学生成绩分析 3.1 学生整体成绩分布 3.2 不同学科成绩间的关联度以及不同学生人群擅长科目 https://cloud.tencent.com/developer/article/2124430
6.Python数据分析实战项目介绍南鹤Python 语言是数据分析领域最常用的编程语言,因此本文将向大家介绍一个Python数据分析实战项目,学完这个项目大家可以使用 Pandas 进行数据准备、清洗、整理、计算与可视化,以及掌握最主流的数据可视化框架Seaborn和Echarts,并利用Bokeh实现动态可视化图表与控制面板。如果对学习Python数据分析的相关内容感兴趣就接着看下去吧! https://www.cnblogs.com/nanhe/p/13508805.html
7.Java是否适合运维会java可以做运维吗ctaxnews的技术博客数据离线数据仓库,企业级在线教育项目实战(Hive数仓项目完整流程) 本课程会、建立集团数据仓库,统一集团数据中心,把分散的业务数据集中存储和处理 ;目从需求调研、设计、版本控制、研发、测试到落地上线,涵盖了项目的完整工序 ;掘分析海量用户行为数据,定制多维数据集合,形成数据集市,供各个场景主题使用。 https://blog.51cto.com/u_14850/6765228
8.寻找接地气的Python实战项目基于股票的金融数据量化分析而是说如果你学习了Python,同时你对数据分析感兴趣,或是对金融量化交易感兴趣,或是计划开发属于自己的量化交易系统,或是准备从事金融数据分析领域,那么恭喜你,你可以把量化交易作为Python实战项目来练手。 一方面可以提高自己的Python实战能力,因为这个项目是一个多技术综合的项目,包括爬虫、数据分析、可视化、WEB开发、https://www.imooc.com/article/290298
9.R语言数据分析项目精解:理论方法实战高清pdf完整版[43MB]电《R 语言数据分析项目精解:理论、方法、实战》以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用R 语言和统计学列出了详细的解决方案和过程。《R 语言数据分析项目精解:理论、方法、实战》共9 章,前两章分别为总论和R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及AB 测试https://www.jb51.net/books/697401.html
10.《Excel数据分析师突击—从入门到精通到项目实战》快班报名:【快班】Excel数据分析师突击—从入门到精通到项目实战(随报随学) 大数据时代的到来,机器学习算法的不断发展,各种高深的算法也成了数据分析员日常讨论的话题,然而,并不是每一个岗位的数据分析都需要用到各种高深的机器学习算法,很多职场中的数据分析往往只涉及基础的部分,无需用到各种复杂难懂的算法,只需要http://www.dataguru.cn/article-10127-1.html
11.成功大数据项目实战案例福特汽车用这些方法把所有的数据都界定好了以后,第二步是把项目交给了一个差不多200人的大数据分析专业团队,他们获取和搜索所需的外部数据,比方说第三方合同网站,区域经济数据、就业数据等等。 第三步是他们获得数据以后,就开始对数据进行建模分析、挖掘,为销售和决策部门提供精准可靠的角色选择和效果分析,也就是说https://cda.pinggu.org/view/20251.html
12.项目小组介绍1.项目小组简介: 本项目小组主要研究方向为药物重定位平台的构建、基于药物重定位平台与生物组学数据库的药物预测、基于GEO、TCGA、GTEx等多种组学数据库及整合机器学习方法的生物信息挖掘与分析、python、R语言编程基础学习及项目实战、高分SCI论文的学习及复现。本小组旨在通过文献学习、论文撰写和数据分析项目实战等方式http://www.sxmu.edu.cn/bdcd/info/1098/1302.htm
13.《R语言数据分析与可视化从入门到精通》(程乾)简介书评本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和高级统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。 第3篇:实战篇(第12章)。本篇通过一个实战案例,综合http://product.dangdang.com/29136211.html
14.职业方向定位职业生涯规划书(通用10篇)再之后去了xx,在那里兼职了一个多月,参与了大众汽车销量数据短期预测的项目,一个小项目下来,数据分析的方法流程掌握了不少,也了解了企业是如何用一些时间序列模型去参与预测的,如何选取某个拟合曲线作为预测值。现在,我来到新的地方实习,也非常幸运的参加了一个央企的码头堆场优化系统设计,其实也算数据分析的一种吧https://www.yjbys.com/jiuyezhidao/zhiyeguihua/2957515.html