用户画像(UserProfile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。
男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。
用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。
用户画像有很多的的标签组成,每个标签都规定了观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?
也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?
用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。另外一个方面就是,金融企业利用统计的信息,开发出适合目标客户的产品。
用户画像一词具有很重的场景因素,不同企业对于用户画像有着不同对理解和需求。举个例子,金融行业和汽车行业对于用户画像需求的信息完全不一样,信息纬度也不同,对画像结果要求也不同。每个行业都有一套适合自己行业的用户画像方法,但是其核心都是为客户服务,为业务场景服务。
一个标签通常是人为规定的高度精炼的特征标识。
如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。
如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。
如,红酒0.8、李宁0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。
标签权重
矿泉水1//超市
矿泉水3//火车
矿泉水5//景区
案例:你是我的优乐美,优乐美用户促销
所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1
红酒1//浏览红酒
红酒5//购买红酒
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7*1=0.665,即,用户A:红酒0.665、长城0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。
人口属性、资产特征、营销特性、兴趣爱好、购物爱好、需求特征
市场上用户画像的方法很多,许多企业也提供用户画像服务,将用户画像提升到很有逼格一件事。金融企业是最早开始用户画像的行业,由于拥有丰富的数据,金融企业在进行用户画像时,对众多纬度的数据无从下手,总是认为用户画像数据纬度越多越好,画像数据越丰富越好,某些输入的数据还设定了权重甚至建立了模型,搞的用户画像是一个巨大而复杂的工程。但是费力很大力气进行了画像之后,却发现只剩下了用户画像,和业务相聚甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说是得不偿失,无法向领导交代。
描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。任何企业进行用户画像的目的是寻找目标客户,其必须是具有潜在消费能力的用户。信用信息可以直接证明客户的消费能力,是用户画像中最重要和基础的信息。一句戏言,所有的信息都是信用信息就是这个道理。其包含消费者工作、收入、学历、财产等信息。
用户画像的目的是为产品筛选出目标客户,定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。
例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。参考资产信息也可以将客户定义为高、中、低级别。定性信息的类别和方式方法,金融可以从自身业务出发,没有固定的模式。
将金融企业各类定量信息,集中在一起,对定性信息进行分类,并进行定性化,有利与对用户进行筛选,快速定位目标客户,是用户画像的另外一个原则。
用于描述用户收入潜力和收入情况,支付能力。帮助企业了解客户资产情况和信用情况,有利于定位目标客户。客户职业、收入、资产、负债、学历、信用评分等都属于信用信息。
金融企业内部的信息分布在不同的系统中,一般情况下,人口属性信息主要集中在客户关系管理系统,信用信息主要集中在交易系统和产品系统之中,也集中在客户关系管理系统中,消费特征主要集中在渠道和产品系统中。
数据仓库成为用户画像数据的主要处理工具,依据业务场景和画像需求将原始数据进行分类、筛选、归纳、加工等,生成用户画像需要的原始数据。
千万不要将用户画像工作搞的过于复杂,同业务场景关系不大,这样就让很多金融企业特别是领导失去用户画像的兴趣,看不到用户画像的商业,不愿意在大数据领域投资。为企业带来商业价值才是用户画像工作的主要动力和主要目的。
金融企业集中了所有信息之后,依据业务需求,对信息进行加工整理,需要对定量的信息进行定性,方便信息分类和筛选。这部分工作建议在数据仓库进行,不建议在大数据管理平台(DMP)里进行加工。
定性信息进行定量分类是用户画像的一个重要工作环节,具有较高的业务场景要求,考验用户画像商业需求的转化。其主要目的是帮助企业将复杂数据简单化,将交易数据定性进行归类,并且融入商业分析的要求,对数据进行商业加工。例如可以将客户按照年龄区间分为学生,青年,中青年,中年,中老年,老年等人生阶段。源于各人生阶段的金融服务需求不同,在寻找目标客户时,可以通过人生阶段进行目标客户定位。企业可以利用客户的收入、学历、资产等情况将客户分为低、中、高端客户,并依据其金融服务需求,提供不同的金融服务。可以参考其金融消费记录和资产信息,以及交易产品,购买的产品,将客户消费特征进行定性描述,区分出电商客户,理财客户,保险客户,稳健投资客户,激进投资客户,餐饮客户,旅游客户,高端客户,公务员客户等。利用外部的数据可以将定性客户的兴趣爱好,例如户外爱好者,奢侈品爱好者,科技产品发烧友,摄影爱好者,高端汽车需求者等信息。
将定量信息归纳为定性信息,并依据业务需求进行标签化,有助于金融企业找到目标客户,并且了解客户的潜在需求,为金融行业的产品找到目标客户,进行精准营销,降低营销成本,提高产品转化率。另外金融企业还可以依据客户的消费特征、兴趣爱好、社交信息及时为客户推荐产品,设计产品,优化产品流程。提高产品销售的活跃率,帮助金融企业更好地为客户设计产品。
利用数据进行画像目的主要是为业务场景提供数据支持,包括寻找到产品的目标客户和触达客户。金融企业自身的数据不足以了解客户的消费特征、兴趣爱好、社交信息。
金融企业可以引入外部信息来丰富客户画像信息,例如引入银联和电商的信息来丰富消费特征信息,引入移动大数据的位置信息来丰富客户的兴趣爱好信息,引入外部厂商的数据来丰富社交信息等。
金融行业外部数据源较好合作方有银联、芝麻信用、运营商、中航信、腾云天下、腾讯、微博、前海征信,各大电商平台等。市场上数据提供商已经很多,并且数据质量都不错,需要金融行业一家一家去挖掘,或者委托一个厂商代理引入也可以。独立第三方帮助金融行业引入外部数据可以降低数据交易成本,同时也可以降低数据合规风险,是一个不错的尝试。另外各大城市和区域的大数据交易平台,也是一个较好的外部数据引入方式。
用户画像主要目的是让金融企业挖掘已有的数据价值,利用数据画像技术寻找到目标客户和客户的潜在需求,进行产品推销和设计改良产品。
用户画像从业务场景出发,实现数据商业变现重要方式。用户画像是数据思维运营过程中的一个重要闭环,帮助金融企业利用数据进行精细化运营和市场营销,以及产品设计。用户画像就是一切以数据商业化运营为中心,以商业场景为主,帮助金融企业深度分析客户,找到目标客户。
DMP可以帮助信用卡公司筛选出未来一个月可能进行分期付款的客户,电子产品重度购买客户,筛选出金融理财客户,筛选出高端客户(在本行资产很少,但是在他行资产很多),筛选出保障险种,寿险,教育险,车险等客户,筛选出稳健投资人,激进投资人,财富管理等方面等客户,并且可以触达这些客户,提高产品转化率,利用数据进行价值变现。DMP还可以了解客户的消费习惯、兴趣爱好、以及近期需求,为客户定制金融产品和服务,进行跨界营销。利用客户的消费偏好,提高产品转化率,提高用户黏度。
DMP还作为引入外部数据的平台,将外部具有价值的数据引入到金融企业内部,补充用户画像数据,创建不同业务应用场景和商业需求,特别是移动大数据、电商数据、社交数据的应用,可以帮助金融企业来进行数据价值变现,让用户画像离商业应用更加近一些,体现用户画像的商业价值。
银行具有丰富的交易数据、个人属性数据、消费数据、信用数据和客户数据,用户画像的需求较大。但是缺少社交信息和兴趣爱好信息。
到银行网点来办业务的人年纪偏大,未来消费者主要在网上进行业务办理。银行接触不到客户,无法了解客户需求,缺少触达客户的手段。分析客户、了解客户、找到目标客户、为客户设计其需要的产品,成了银行进行用户画像的主要目的。银行的主要业务需求集中在消费金融、财富管理、融资服务,用户画像要从这几个角度出发,寻找目标客户。
简单介绍一些DMP可以做到的数据场景变现。
A寻找分期客户
利用发卡机构数据+自身数据+信用卡数据,发现信用卡消费超过其月收入的用户,推荐其进行消费分期。
B寻找高端资产客户
利用发卡机构数据+移动位置数据(别墅/高档小区)+物业费代扣数据+银行自身数据+汽车型号数据,发现在银行资产较少,在其他行资产较多的用户,为其提供高端资产管理服务。ookilllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
C寻找理财客户
利用自身数据(交易+工资)+移动端理财客户端/电商活跃数据。发现客户将工资/资产转到外部,但是电商消费不活跃客户,其互联网理财可能性较大,可以为其提供理财服务,将资金留在本行。
D寻找境外游客户
E寻找贷款客户
保险行业的产品是一个长周期产品,保险客户再次购买保险产品的转化率很高,经营好老客户是保险公司一项重要任务。保险公司内部的交易系统不多,交易方式不是很复杂,数据主要集中在产品系统和交易系统之中,客户关系管理系统中也包含丰富了信息,但是数据集中在很多保险公司还没有完成,数据仓库建设可能需要在用户画像建设前完成。
保险公司主要数据有人口属性信息,信用信息,产品销售信息,客户家人信息。缺少兴趣爱好、消费特征、社交信息等信息。保险产品主要有寿险,车险,保障,财产险,意外险,养老险,旅游险。
保险行业DMP用户画像的业务场景都是围绕保险产品进行的,简单的应用场景可以是。
A
依据自身数据(个人属性)+外部养车App活跃情况,为保险公司找到车险客户。
B
依据自身数据(个人属性)+移动设备位置信息,为保险企业找到商旅人群,推销意外险和保障险。
C
依据自身数据(家人数据)+人生阶段信息,为用户推荐理财保险,寿险,保障保险,养老险,教育险。