标签分类的三种方式:按用途按统计方式和按时效分类

标签体系是整个用户画像建设的地基,不打好地基,摩天大楼就不可能平地而起。草帽小子在做调研及规划过程中,就深深认识到标签体系的重要性,接下来草帽小子会重点介绍标签体系。

一、标签分类

不同公司的标签分类有所不同,目前市面上有三种常用的标签分类方式:

1.按用途分类

按用途分类的标签,可分为基础信息、用户行为、业务偏好、场景标签。通常面向产品/业务人员,分类时需要根据实际的业务需要进行类别划分,以便适配业务人员在通用场景和定制场景下标签的使用。

1)基础信息

标签基础信息标签,是用于描述用户的基础属性,包含自然属性、社会属性、业务属性等,如性别、年龄、常驻城市、RFM、会员等级等标签。

①年龄

人们在一生中购买不同的商品和服务,在幼年时吃婴儿食品,在发育时期和成年时期吃各类食物,在晚年吃特殊的低热量食品。人们对衣服、家居和娱乐等的喜好也跟年龄有关,这也就是为什么年龄是画像中常用的标签。

②职业和收入水平

职业影响一个人的消费模式,如蓝领工人通常会买工作服,公司的董事长则会买名牌服装及高端产品。不同职业的人群收入水平不同,针对高收入水平的消费者,可向其推荐更优质的商品,促进商品转化率。

2)用户行为标签

他的理论是,人类的需求是按层次排列的,从最迫切的需求到最不迫切的需求。按重要程度排列,这五种需求分别是:生理需求、安全需求、社会需求、尊重需求和自我实现需求。

消费者总是先寻求满足最重要的需求,当最重要的需求得到满足之后,他就会寻求满足下一个最迫切的需求。

3)业务偏好标签

业务偏好标签,用于描述用户的偏好业务内容,根据公司业务不同,划分不同的分类,通常电商行业业务偏好类标签包含运动户外、数码家电、食品保健等,其他行业的业务偏好标签根据实际业务而定。

一般情况下,以上这3类标签即可满足常用的标签使用需求,因为其已描述who(基础信息)do(用户行为)what(业务偏好)的整个过程,该用户的行为合集构成了整个用户画像。

但随着标签的使用,业务人员发现,经常会有些同类似的活动,使用到了类似的标签组合,类似的人群包。于是这类标签组合便可沉淀下来,针对特定场景使用。

4)场景应用标签

场景应用标签,用于特定场景下使用,由业务使用经验积淀而来,例如618/双十一活动标签,双十一预付定金人群、双十一下单人群等。标签建设初期可不设置此分类。

2.按统计方式分类

按统计方式分类的标签可分为事实类标签、规则类标签、预测类标签。与按用途分类不同的是,按统计方式分类的3类标签通常面向研发人员,意指标签是按何种方式计算而来,其复杂程度、产研成本由低至高。

1)事实类标签

事实类标签是用户画像最基础、最常见的标签,通常是基于原始数据清理后的归类,用于描述客观事实。例如,姓名、会员等级、终端类型、购买次数、购买金额等。

2)规则类标签

规则类标签,顾名思义,是基于确定的规则而产生。与事实类标签不同的是,规则类标签拥有更多的业务属性,其业务规则需与业务人员共同制定。例如,将“活跃用户”标签可定义为,“过去30天发生a行为x次”&“过去30天发生b行为x次”,进行综合评定。

①用户活跃度标签

在这里,靠拍脑门可行不通,标签讲究定义有依据、建设有方法。

首先划分用户的流失周期,运用拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。

比如图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点。

②四分位数

也称为四分位点,是指在统计学中把所有数值从小到大排列并分为四等分,处于三个分割点位置的数值。

如历史数据,选择近1个月访问APP次数在0-8之间,则取3/4分位点为6、1/4分位点为2。

③RFM标签

我们在设计RFM标签时,可根据二八定律来进行标签分级。

④二八定律

二八定律又名80/20定律、帕累托法则,它是在19世纪末由意大利经济学家帕累托发现的。

帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。给一个公司带来80%利润的是20%的客户,按照这个原则,如果能把这20%的客户找出来,提供更好的服务,这对于公司的发展和业绩增长起到至关重要的作用。

客户类型可划分为:

3)预测类标签

预测类标签,基于现有事实及规则无法得出,需要运用决策树算法、贝叶斯算法等进行数据挖掘与训练,得出标签预测结果。

预测类标签复杂度高、开发周期长、开发成本高,且需要算法工程师参与,通常此类标签的占比较少。

3.按时效分类

1)静态标签

2)动态标签

动态标签需要动态更新,来保持标签的有效性,如近7天购买次数、近30天加购次数等。

二、标签分级

随着标签的增多,当标签数量发展到成百上千量级时,业务方要从中找一个标签就会十分困难。所以标签在建设初期就需要进行分级分类的管理,就像整理电脑文件夹一般,分类清晰的标签更便于查询使用。

标签常用的分级结构为:一级标签、二级标签、三级标签、四级……逐级往下分。

注意:建设初期要注意的是层级不必生搬硬套、划分过细,根据标签建设实际情况划分即可。如果公司只有几十个标签,则划分至二级足矣,过细反而累赘。

本文由@一个数据人的自留地原创发布于人人都是产品经理。未经许可,禁止转载

THE END
1.数据挖掘师在市场中的地位与未来的展望随着大数据技术的飞速发展,数据挖掘这一领域也迎来了前所未有的爆炸性增长。作为一名专业的数据分析人员,数据挖掘师不仅需要具备深厚的数学和统计学知识,还要有强大的编程能力以及对业务模式的深刻理解。在这个信息爆炸时代,能够从海量数据中提取有价值信息的人才是最宝贵的。 https://www.f3kg3td6j.cn/jun-lei-zi-xun/496259.html
2.数据挖掘类文章属于什么类型mob64ca12e83232的技术博客随着数据量的增长和技术的发展,数据挖掘的潜力将愈发显著。未来,数据挖掘将在决策支持、市场分析、个性化推荐等领域发挥更大的作用。 希望通过本篇文章,您对数据挖掘类文章的内容及其实现有了初步的了解。如需进一步学习,建议深入阅读相关领域的专业书籍与文献,探索更复杂和有趣的算法与技术。https://blog.51cto.com/u_16213397/12827058
3.C语言在数据挖掘中的作用编程语言C语言在数据挖掘中扮演着重要的角色,尽管它可能不是最常用的工具,但它的性能和灵活性使其在特定情况下非常有用。C语言在数据挖掘中的应用主要体现在以下几个方面: C语言在数据挖掘中的作用 高效处理大数据:C语言允许程序员直接操作内存,提高程序的执行效率,适合处理大规模数据集和复杂计算任务。 自定义算法开发:Chttps://m.yisu.com/zixun/942501.html
4.海量数据处理中数据挖掘技术及应用工具探析百客网数据挖掘技术涉及多个领域的知识,包括统计学、机器学习、数据库技术、人工智能等。其中,机器学习算法在数据挖掘中发挥着重要作用。通过训练模型,机器学习算法能够自动地识别和提取数据中的模式,从而预测未来的趋势和结果。这些算法包括决策树、神经网络、支持向量机等,它们在海量数据处理中发挥着至关重要的作用。 https://www.yubaike.com.cn/html/shuju/2024-12-16/370030.html
5.数据挖掘有什么作用与意义帆软数字化转型知识库数据挖掘的作用与意义在于能够帮助企业和组织:发现隐藏模式、提高决策质量、预测未来趋势、优化资源配置、提升客户满意度、推动创新。其中,发现隐藏模式尤为重要,因为数据挖掘能从海量数据中提取出有价值的信息和知识,这些信息可能是传统分析方法难以发现的。通过算法和技术手段,企业可以识别出一些潜在的、影响业务发展的关键https://www.fanruan.com/blog/article/575539/
6.以下哪项不属于数据挖掘的用途()。以下哪项不属于数据挖掘的用途( )。A.报表B.分类C.聚集D.描述的答案是什么.用刷刷题APP,拍照搜索答疑.刷刷题(shuashuati.com)是专业的大学职业搜题找答案,刷题练习的工具.一键将文档转化为在线题库手机刷题,以提高学习效率,是学习的生产力工具https://www.shuashuati.com/ti/9c38adbb5b6c414a9990eb8c032e6001.html?fm=bdaff2387862428f11553abdcd67795a99
7.数据挖掘导论(一):数据挖掘的定义,方法,用途数据挖掘是自动从大型数据存储库中发现有用信息的过程,涉及预测建模、关联分析、聚类分析和异常检测。预测任务用于根据已有属性预测目标变量,描述任务则寻找数据间的潜在联系。关联分析揭示强关联特征,聚类分析发现相似观测值群体,异常检测则用于识别数据中的异常点。数据挖掘起源于机器学习、统计学和数据库系统,广泛应用于https://blog.csdn.net/zheng_nh/article/details/106729922
8.数据仓库普及:发展历程特点用途技术架构应用嘲详解随着信息技术的飞速发展,数据已成为企业最重要的资产之一。数据仓库作为数据存储、处理和分析的重要工具,其在企业决策支持、业务智能、数据分析等方面的作用日益凸显。本文将详细探讨数据仓库的发展历程、特点、用途、技术、架构以及应用场景,以期为读者提供全面的了解。 https://www.selectdb.com/blog/912
9.信息检索的意义6篇(全文)(1) 对新入学新生, 开设“信息意识基础”的教育内容, 帮助新生认识获取和利用信息的重要性。系统地介绍图书馆的布局与资源状况, 让学生了解图书馆的馆藏结构, 掌握必要的检索系统, 使学生对图书馆有全面具体的认识, 初步了解文献检索最基本的理论和作用。 https://www.99xueshu.com/w/ikeybz3y3q4f.html
10.什么是网络爬虫?它的主要用途是什么?主要用途 网络爬虫在现代信息时代发挥着重要作用,其主要用途包括:1. 搜索引擎索引 搜索引擎如Google、Bing和Yahoo等使用网络爬虫来构建其搜索结果数据库。爬虫程序定期访问互联网上的网页,检索和索引这些页面的内容,使搜索引擎能够快速响应用户的搜索请求。这有助于用户在互联网上找到他们所需的信息。2. 数据挖掘与https://baijiahao.baidu.com/s?id=1780807911348296759&wfr=spider&for=pc
11.华北理工大学研究生学院硕士研究生培养方案重点针对特定数据挖掘领域的挖掘算法、挖掘模型进行理论研究和试验仿真。本方向结合神经网络、贝叶斯网络等理论方法,将研究成果应用到工业控制之中,研究规律挖掘结果对智能控制的影响,目的在于研究和探索数学应用的新途径和新方法。 2. 应用数理统计 本研究方向从理论上研究随机现象的数量规律,联系各领域实际研究如何收集、http://www.okaoyan.com/hebeiligongdaxue/yanjiushengyuan_261121.html
12.自动化仪表论文(精选12篇)在自动化仪表的作用下,工业生产的产品更加精细化,严格的数据控制和监控,保证了产品的质量,也提高了生产产品的效率,进而促进了企业的不断发展。在企业生产线上将电气、计算机技术、机械科学的组合在一起,使得工业生产流程实现了自动化,流水线的自动化生产极大的提高了成品率和生产效率。 https://www.yjbys.com/biyelunwen/fanwen/zidonghua/661884.html
13.智慧旅游:景区电子票务系统建设方案流媒体网如果景区计划园内员工也通过道闸入园,系统也可以实现。员工卡一般选用非接触式ID/IC卡,这需要在其中一台闸机上安装ID/IC卡读卡器,作为员工卡验卡设备,检票机同样可以验证,并根据员工卡的有效性决定是否放行,同时系统内有进出数据记录,以便查询。 2.4.1 通道闸机系列功能用途特点: https://lmtw.com/mzw/content/detail/id/113864/keyword_id/-1
14.浅析数据挖掘技术在审计中的运用澎湃号·媒体澎湃新闻二、数据挖掘技术在审计中的重要作用 数据挖掘技术作为信息技术的一种特有的技术手段应用在审计领域,是传统审计方法无法取代的。通过数据挖掘技术可以从被审计单位错综复杂的业务环境和海量的数据中,在极短的时间里进行数据分析,协助审计人员更加高效发现异常信息,在一定程度上较低了审计风险,从而大大提高了审计效率,更加https://www.thepaper.cn/newsDetail_forward_15006269
15.什么是大数据?大数据的产生特点用途大数据的产生、特点、用途 一.什么是大数据 大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。https://blog.itpub.net/70015517/viewspace-2877224/
16.浅谈数据挖掘中的个人信息保护【摘要】数据挖掘是当今社会最为重要的发现工具,它在为人们揭示出数据中的隐藏规律并创造出财富的同时,也对各类数据有着大量的需求。随着互联网的出现和发展,对所需数据的收集、交换和发布的过程正变得越来越便利。然而,这些丰富的数据资源中也同时包含着大量的个人隐私。更令人担忧的是,在这些数据的实际使用过程中,http://media-ethic.ccnu.edu.cn/info/1168/2097.htm
17.泰政发〔2004〕64号关于2004年度泰安市科技进步奖励的决定5、税务数据仓库与数据挖掘系统 完成单位:泰安市国家税务局 泰安市恒信科技有限公司 完成人员:赵秦鲁、张德志、张焕昌、胡志京、王庆大 6、公安综合管理及四级业务网络办公系统 完成单位:泰安市鲁科海电子信息产业有限公司 泰安市公安局 完成人员:戚哲凯、胡敬明、张承勇、牛静涛、胡传东 https://www.taian.gov.cn/art/2011/2/23/art_256554_3612.html
18.企业的管理理念基于此,企业应充分挖掘传统管理文化中的有益成分,如“道法自然”“以义取利”等理念,以便活学活用,使之在新的社会环境中继续为当代企业管理理念创新发挥积极的作用,赋予新型管理理念以丰富的文化内涵。 3.2既有管理环境推动理念创新 环境是管理理念创新的外部要素,为了更好地实现管理理念创新,需要创设便于管理理念https://www.jy135.com/guanli/2322078.html
19.数据分析主要包括哪些内容王利头有效的数据分析涉及清楚地传达结果并提出可行的建议。这包括创建报告、进行演示和提供见解以指导决策制定。 SEO中数据分析的作用 数据分析在SEO中起着至关重要的作用,有助于优化网站并提高其搜索引擎排名。一些具体用途包括: 关键字研究:分析用户搜索查询以确定相关关键字。 https://www.wanglitou.cn/article_47134.html
20.计算机数据库论文15篇优秀计算机软件的开发解决了人们在计算机应用中的实际问题,使计算机应用更加适应人们的生活需要。计算机软件开发作为一项创新性要求比较高的技术,在当前的计算机发展史中有着十分重要的作用。计算机的应用和发展也需要一些计算机软件和数据库技术的支撑,计算机软件的开发在当前的计算机技术发展中有着美好的前景。https://m.fwsir.com/ligong/html/ligong_20230721071337_3075651.html
21.网赌大数据分析工具(网赌数据库)Open Refine不适用于大型数据集;精炼对大数据不起作用 十二、KNIME 1、什么是KNIME - 数据分析工具 KNIME通过可视化编程帮助您操作,分析和建模数据。它用于集成各种组件,用于数据挖掘和机器学习。 2、KNIME的用途 不要写代码块。相反,您必须在活动之间删除和拖动连接点;该数据分析工具支持编程语言;事实上,分析工具,例https://www.jiandaoyun.com/article/post/13404.html
22.GIS网络分析的主要功能及用途是什么?GIS网络分析的主要功能及用途是什么? 参考答案:GIS网络分析的主要功能和作用:主要功能:路径分析、地址匹配、资源分配、流量分析、连通分析和选址等;主要用途:选择最佳路 点击查看答案进入题库练习 查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧 无需下载 立即使用 你可能喜欢 问答题 简述加强https://m.ppkao.com/mip/tiku/shiti/5532429.html