首先来看用户画像的定义。1.用户画像的定义
引用这个定义是为了引出标签的概念,以及标签在画像中的作用,或者说标签和画像之间的关系。标签可以理解为对用户各种类型数据的提炼总结,可能就是用一个词或者说是用一个短语来表达用户在某个方面的一项特征。用户有各种各样的特征,因此需要有海量的标签去完整地描述一个用户。这样做的好处在于能够可视化表征用户特征,让我们更加便捷清晰的了解我们的客户,这是用户画像的意义所在:用户画像其实就是对用户关联数据去进行可视化的展现。一句话总结一下,用户画像的技术特点就是把用户的信息标签化。
2.常见用户画像维度到现在为止对用户画像进行了多种角度的定义,但还是停留在概念层面,不够直观。下面举几个例子加深理解。
3.金融产品常见用户画像
前面列举了用户画像在营销和舆情分析场景中的应用,其实还有一个非常早就开始应用户画像来助力其日常业务的领域,那就是金融领域。而金融领域里面最常见的一个场景就是信用评分画像。
4.群体维度常见的画像
除了可以对单个用户去进行画像之外,也可以对某个群体来进行画像。
1.为什么要做用户画像
业务上:
技术上:
2.示例:画像支撑业务应用接下来,结合明略的用户画像和营销自动化产品,来给大家举一个画像支撑业务应用的例子,非常浅显易懂。
3.标签的作用
标签可以将数据及其含有的信息转化成带有明确的可决策行为的指导。
人参与决策越多的地方,越需要将信息数据进行标签化,以提升人对数据的理解和处理效率,实现人机协同。
第一步:数据在线数据在线指的是通过数字化转型,将业务流程在线化,这样业务流程中产生的数据也就跟着实现了在线化,具备了进一步处理的先决条件。比如以前我们都在超市里买东西,其实很难去统计哪个用户买了什么东西,后续的分析也就很难进行。现在很多人都在电商购物,购物记录实现了数据在线。未来,随着越来越多的业务流程在线化,可以分析的内容也会越来越丰富。
第二步:数据信息转换用户数据转换为信息,这个信息指的是,在我们业务场景下能够解读出来的内容。比如用户姓名王二妮,是一个女性化的名字,当然,可能并不是所有的转化都这么直接。从数据到信息的过程中,需要基于对业务场景的理解,我们不仅需要直接的分析数据,转换数据,还需要赋予数据新的信息,这就是所谓的信息转换,信息增益。
第三步:信息标签转换我们可以通过一些规则,将信息转化为标签。举个例子,当我看到这信息(用户名叫王二妮)的时候,我们就可以判断,大概率90%以上,这个用户是一位女性,就可以给用户一个性别标签,这是一种预测性的标签,所以这个标签是带有权重的,比如90%。第四步:标签指导决策根据标签如何产生决策?在电商场景,用户购买了一款婴儿奶粉产品,接下来该如何去跟他互动?我们结合性别女的标签,去判断,用户大概率是一个妈妈,就应该是适用妈妈型的沟通方式和称呼。这个当然也有可能会有错,比如用户是帮别人买的,送人的。因此可能会要结合多种标签应用,帮助我们决策用什么方式去和用户进行沟通。在这个环节中,并不要求决策百分之百正确。因为大多数业务只是需要一个可以尝试的推荐。接下来每一条数据都是这样的,比如通过数据在线,获得了收货地址,东城区特别贵小区302,通过信息增益补充了房价信息,然后再结合收入和房价模型,就能大概推断出用户的大概收入水平,生成收入水平标签。有了收入水平标签后,能进一步指导决策:对于收入水平比较高的用户,推荐更高端的产品系列。这就是一个典型的,通过数据转化为标签,最终指导决策的过程。
(2)动态数据
2.标签体系建设
数据有了之后,在构建标签之前,我们先聊一聊标签体系的建设。
所谓标签体系,是基于我们既有经验预设好的,用数据解决问题的模型。我们在设计标签体系构的时候,参考了通用的数据解决问题的方法论,即:
第四步:明确我们不同对象在场景中需要的标签类型,例如,是基本属性标签,还是消费偏好表现,是动态标签,还是静态标签,是预测标签,还是行为标签,等等。
最后:确定了类型之后,需要列举出标签的值,比如人口属性标签中的年龄段标签,需要进一步确定出“0-15岁”,“16-18岁”,“18岁以上”等具体的值。
以上是我们构建标签体系的比较通用的方法论,适用于各种用户画像构建过程中设计标签体系。
3.标签与权重用户画像的最终形态,就是通过对用户行为的分析为用户打上标签,以及标签的权重。那么,标签与权重,具体是什么样子?
4.标签建模方法
5.标签分类
下面我们从另外一个角度去看一下标签的分类,如图所示,分成了四层:
6.ID打通
7.用户画像示例
Q3:建立SuperID时,出现多对多的情况,应该怎么处理?A:有不同的处理方法。当出现多对多的时候,可能有几种场景,一种是您刚才说的,一个人有多个deviceid。这种是合理的业务场景,需要存多个。技术选型就不在这里讨论。另外就是在不同渠道拿到不同的信息,比如,从某个渠道拿到用户的信息自称性别是男,另外一个更加靠谱的渠道,比如从身份证信息中拿到用户的更高权重的信息,性别是女,这种从业务场景上来看,是不可能存在多个的,我们需要选择可信度更高的。