Python数据分析,简单的用户画像案例分析

拿到一组用户的交易数据,我们如何做数据分析?常规地做法是做用户画像,比如分别对性别、年龄、受教育水平、婚姻状况等做描述统计分析,研究不同的用户特征对于交易金额的影响。

本文使用Python对一组交易金额数据做数据分析,通过对数据进行预处理,包括数据类型转换、重复值判断、缺失值处理、数据分组,对用户做初步画像,下面一起来学习。

示例工具:anconda3.7

本文讲解内容:交易数据用户画像

适用范围:Python用户画像

使用read_excel命令导入数据。

打印一下数据形状,本次使用的案例数据共计3000行,6列。

data.shape(3000,6)

使用dtypes命令查看数据类型,其中,用户ID为数值类型,交易金额和交易日期为字符类型。

由前文可以知道用户ID为数值类型,交易金额和交易日期为字符类型,这里数据类型不对就不能做对应的数据运算,比如交易金额为字符类型就不能求和只能计数,使用astype函数做数据类型转换。

False

使用isnull()函数判断是否存在缺失值,由结果判断结果得知性别、年龄、受教育水平均有缺失值。

计算各个变量的缺失值比例,如果该变量的缺失值比例大于30%,则不选用该变量作为分析字段。

同时,将年龄中缺失值的行进行删除处理,删除受教育水平变量以及删除年龄变量中缺失行数据,最后数据剩下2900行5列。

除了直接删除缺失行,还可以采用反向选择的方法,反向筛选删除年龄中的缺失值。

(2900,5)

除了使用直接删除的方法删除缺失值外,还可以使用众数或者是平均值进行缺失值填充这里对性别使用众数进行缺失值填充,对年龄使用平均值进行缺失值填充。

研究年龄与交易金额的关系,首先用qcut函数进行分组,将年龄分组为5个年龄段,同时按照分组后的年龄段进行分组求和,绘制柱形图可以得知,年龄段在28~37的交易金额最大,年龄段在37~42的交易金额最小。

上面计算出组距,然后使用pd.cut函数将交易金额进行等额分组,设置bins即可等额分组,同时按照分组结果分组计数,绘制柱形图可以得知,交易金额在1000~1500的人数最多,交易金额在0~500的人数最少。

THE END
1.python数据分析——数据分析的数据模型数据分析的数据模型是决策支持系统的重要组成部分,它通过对大量数据的收集、整理、分析和挖掘,为企业提供有价值的信息,以支持企业的战略规划和日常运营。数据模型的选择和应用,直接关系到数据分析的准确性和有效性,进而影响企业的决策质量和市场竞争力。 在构建数据模型时,首先要明确分析的目标和需求。不同的业务场景需https://open.alipay.com/portal/forum/post/156501040
2.超详细!80个Python入门实例,代码清晰拿来即用,学习提升必备今天给大家分享80个Python入门实例,都是基础实例,经典实用,代码清晰可拿来即用,很适合学习提升使用,适用性广,实用性强。话不多说,一起来看看吧! Python 数字求和 #-*-coding:UTF-8-*-# Filename:test.py # author by:www.runoob.com # 用户输入数字 https://www.bilibili.com/opus/1003657402377043970
3.python数据分析简单案例,python数据分析5个案例大家好,小编来为大家解答以下问题,python数据分析简单案例,python数据分析5个案例,现在让我们一起来看看吧! 公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ 最近小编认真整理了20+个基于python的实战案例,主要包含:数据分析、可视化、机器学习/深度学习、时序预测等,案例的主要特点: https://blog.csdn.net/2401_85422614/article/details/139722526
4.深入浅出Pandas:利用Python进行数据处理与分析数据集清华教育在线系列软件http://netteaching.cqpc.edu.cn/meol/common/script/preview/download_preview.jsp?fileid=78135&resid=27732&lid=12950&preview=preview
5.Python数据可视化:16个实用案例解析本文将带领读者领略16个令人惊叹的Python数据可视化案例,从简单的柱状图到复杂的交互式图表,涵盖了数据可视化的各个方面。通过这些案例,读者将掌握Python数据可视化的基本技巧和方法,并了解如何在实际应用中运用这些技术。https://developer.baidu.com/article/details/2789117
6.pandas数据分析案例:利用python进行汽车数据分析可视化实例–帆软我们只要把这些信息写个爬虫爬下来就可以了。这个简单。按照我们之前写过的爬虫,5分钟,总共不超过20行代码,就把这些数据拿下了。没办法,python爬虫就是这么强大!特别是对于这种第三方机构的网页,基本上没有什么反爬虫措施。爬取后的数据如下,大概10000条: https://www.fanruan.com/bw/panks
7.利用python进行财务分析的心得体会python财务分析案例数据分析是现代社会中一项重要的技能,Python作为一种强大的编程语言,被广泛应用于数据分析领域。本文将通过解析三个实际案例,展示Python在数据处理和数据可视化方面的能力。 案例一:销售数据分析 数据收集 首先,我们需要收集销售数据。通常,这些数据以Excel或CSV文件的形式存储。我们可以使用Python的pandas库来读取这些文件,https://blog.51cto.com/u_16099268/11708238
8.五个Pandas实战案例带你分析操作数据python五个Pandas 实战案例带你分析操作数据 pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效操作大型数据集的工具。pandas提供大量快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python强大而高效的数据分析环境的重要因素之一https://m.jb51.net/article/235878.htm
9.Python数据可视化的10种技能腾讯云开发者社区如果你想要用Python进行数据分析,就需要在项目初期开始进行探索性的数据分析,这样方便你对数据有一定的了解。其中最直观的就是采用数据可视化技术,这样,数据不仅一目了然,而且更容易被解读。同样在数据分析得到结果之后,我们还需要用到可视化技术,把最终的结果呈现出来。 https://cloud.tencent.com/developer/article/1435796