version:"3.3"services:superset:image:apache/supersetcontainer_name:supersetvolumes:-"./startup.sh:/opt/startup.sh"ports:-"8088:8088"mysql:image:mysqlcontainer_name:mysqlenvironment:MYSQL_DATABASE:"superset"MYSQL_ALLOW_EMPTY_PASSWORD:"yes"然后,在同一个目录下创建初始化脚本文件startup.sh,输入以下内容。其中,加载演示数据部分已经注释掉,需要查看演示数据的朋友可以取消注释。
#!/bin/sh#createadminaccountsupersetfabcreate-admin\--usernameadmin\--firstnameSuperset\--lastnameAdmin\--emailadmin@superset.com\--passwordadmin#upgradedatabasesupersetdbupgrade#loadexamples#supersetload_examples#setuprolessupersetinit现在我们已经创建好容器配置文件以及初始化脚本文件,就可以开始启动容器并初始化了。执行以下命令来启动容器以及初始化。
我们可以输入默认用户名密码admin/admin进入界面。
登陆进入Superset之后你会发现目前什么也没有(除非之前取消注释了加载数据)。现在我们需要进行两步操作来创建第一个数据集(Dataset)。
将鼠标悬浮在右上角的加号按钮,继续悬浮到Data,然后点击Connectdatabase。
出现弹窗后,选择MySQL,并输入数据库连接信息,如下图。然后点击Connect,继续点击Finish完成数据库连接。
为了在Superset上尽快体验交互式数据分析,我们将选择上传一个Excel数据文件到Superset。
不过在此之前,我们需要多做一步,即在MySQL中允许上传文件。这个可以通过Superset界面进行设置。操作如下。
好了,现在我们可以上传Excel文件了!
在右上角点击Uploadfiletodatabase然后点击UploadExcelfile。
然后,在上传Excel页面中,选择要上传的文件,输入表名为sales,点击下方的Save按钮,即可创建数据集。
上传Excel数据文件完毕后,你可以在Datasets中看到已经创建好的数据集。
接下来我们来看看如何在Superset中分析该数据。
点击刚才创建好的sales数据集,进入到分析页面。如果你对PowerBI或者Tableau熟悉的话,你会发现这其实就是PowerBI的Visual,或Tableau中的Chart。其最左侧是数据集的各个字段,旁边是数据操作区域,右侧是图标展示区域。
现在,我们想看看按季度的销售额是多少。将左侧的SALES拖到METRICS,并选择SUM;然后将YEAR_ID和QTR_ID拖到DIMENSIONS;再点CREATECHART。我们可以看到如下统计表格。
从上图可以看到,销售额(Sales)似乎受季节性影响:每个冬季,也就是第四季度会有大量的销售额。这是因为,欧美国家会在圣诞节期间大量采购节日礼品以及物资,形成较高的销售额。因此,这个发现也不意外。
以上,我们通过鼠标操作几下,就创建了两个简单的图表,从而完成了简单的可视化数据分析。Superset虽然功能上还不及商业软件PowerBI和Tableau,但这对于咱们白嫖玩家来说已经完全够用!