首期专访人物——中国顶尖数据科学家董飞
访谈主题:大数据技术在预测性营销上的实践
访谈录
DT学院:请您谈谈什么是预测营销?
董飞:说到预测营销,不得不先提个性化的用户画像。我们针对每一类数据实体,进一步分解可落地的数据维度,刻画他/她的每一个特征,在聚集起来形成人群画像。比如下面就是两种典型年轻消费人群。
预测营销中的元素具体包括:
用户固定特征:性别,年龄,地域,教育水平,生辰八字,职业,星座
用户社会特征:生活习惯,婚恋,社交/信息渠道偏好,宗教信仰,家庭成分
用户消费特征:收入状况,购买力水平,商品种类,购买渠道喜好,购买频次
我们再说一说营销时代的变迁,传统的企业大多还停留在“营销1.0”时代,消费者需要什么,企业提供什么,而进入“营销2.0”,以社会价值与品牌为使命,也不能完全精准对接个性化需求。进入营销3.0的数据时代,我们要对每个消费者进行个性化匹配,一对一营销,甚至精确算清楚成交转化率,提高投资回报比。
预测营销能够让你专注于一小群客户,而这群客户却能代表特定产品的大多数潜在买家。以上图为例,你可以将营销活动的目标受众锁定为20万潜在客户或现有客户,其中包括特定产品的大多数买家(4万人)。你还可以拨出部分预算用于吸引更小的客户群(比如20%的客户),而不是整个客户群,进而优化你的支出。
DT学院:在现代商业中大数据的价值体现在哪?
董飞:大数据最大的价值不是事后分析,而是预测和推荐。我就拿电商举例,"精准推荐"成为大数据改变零售业的核心功能。譬如服装网站Stitchfix例子,在个性化推荐机制方面,大多数服装订购网站采用的都是用户提交身形、风格数据+编辑人工推荐的模式,StitchFix不一样的地方在于它还结合了机器算法推荐。这些顾客提供的身材比例,主观数据,加上销售记录的交叉核对,挖掘每个人专属的服装推荐模型。这种一对一营销是最好的服务。
数据整合改变了企业的营销方式,现在经验已经不是累积在人的身上,而是完全依赖消费者的行为数据去做推荐。未来,销售人员不再只是销售人员,而能以专业的数据预测,搭配人性的亲切互动推荐商品,升级成为顾问型销售。
DT学院:能举个例子说明精准营销的好处么?
以往的方法是这样的:评估网络问卷大约是5%的回收率,想要保证收到200份的问卷,就必须有20倍的发送量,也就是发出4000份问卷,一个月内如果可以回收,就是不错的表现。
但现在不一样了,在执行大数据分析的3小时内,就可以轻松完成以下的目标:
1.精准挑选出1%的VIP顾客
2.发送390份问卷,全部回收
3.问卷寄出3小时内回收35%的问卷
4.5天内就回收了超过目标数86%的问卷数
DT学院:如何生成用户的精准画像?
董飞:大致分成三步:1.采集和清理数据:用已知预测未知;2.用户分群:分门别类贴标签;3.制定策略:优化再调整。
§采集和清理数据:用已知预测未知
我们用已知的数据寻找线索,不断挖掘素材,不但可以巩固老会员,也可以分析出未知的顾客与需求,进一步开发市场。
§用户分群:分门别类贴标签
在分析阶段,数据会转换为影响指数,进而可以做"一对一"的精准营销。举个例子,一个80后客户喜欢在生鲜网站上早上10点下单买菜,晚上6点回家做饭,周末喜欢去附近吃日本料理,经过搜集与转换,就会产生一些标签,包括"80后""生鲜""做饭""日本料理"等等,贴在消费者身上。
§制定策略:优化再调整
我们从数据整合导入开始,聚合数据,在进行数据的分析挖掘。数据分析和挖掘还是有一些区别。数据分析重点是观察数据,单纯的统计,看KPI的升降原因。而数据挖掘从细微和模型角度去研究数据,从学习集,训练集发现知识规则,除了一些比较商业化的软件SAS,WEKA功能强大的数据分析挖掘软件,这边还是更推荐使用R,Python,因为SAS,SPSS本身比较昂贵,也很难做页面和服务级别的API,而Python和R有丰富的库,可以类似WEKA的模块,无缝交互其他API和程序,这里还需要熟悉数据库,Hadoop等。
在算法部分,我们通过相似度衡量聚类算法,主要核心是数据简化,让它具备大规模数据的能力,这里做变换,降维,抽样。在分类这一块,我们使用了决策树,Boosting监督的分类学习方法,随机森林来解决回归和分类问题。
DT学院:请谈谈你们公司目前怎么做精准营销的,比如如何拉新和留存客户?
董飞:我们公司(Datatist)是专注于用大数据机器学习技术自动支持企业的智能决策和商业优化。拥有外部营销和内部营销相结合的闭环一体化用户运营优化解决方案。
对于外部营销优化:通过机器学习内部客户的特征,结合word2vec,神经网络多种模型精准预测最可能转化的潜在外部客户。
对于内部营销优化:通过机器学习客户的行为特征,精准预测最可能活跃的客户,最可能购买的客户等。并且通过内部触达渠道刺激用户转化,A/Btest,效果跟踪和持续优化等一站式解决方案提高内部客户的转化率。
我们模型使用的算法包括神经网络,逻辑回归,随机森林和回归树,但这些对于营销人员意义不大,重要的是,可能性模型是通过学习历史行为来预测客户未来动作的。下面在使用模型之前,训练期和调试期使用历史数据的方法。
拉新和留存是很多客户最关心的,我们的做法是通过数据挖掘和机器学习的方式提升效率,并且两者是有关联,通过内部留存每一步的跟踪和转化,我们可以刻画用户的精准画像,对不同分类的客户做不同刺激,预测可能转化的用户,并将特征记录下来,对外部的拉新数据能够重用。
以最常使用的电子邮件推送为例,以往只能盲目发送,消费者没反应就再发一次。导入大数据分析后,可以很精准地掌握消费者的打开情况,消费者没有点开阅读一定有原因,一种策略是规划促销活动,再次发送给没点开的消费者,观察哪些消费者对促销内容有反应,不断回馈修正。还有一种策略是建立每个消费者的消费习惯周期,比如顾客A是每隔30天购买,顾客B每隔60天购买,那么通过建模,第30天是顾客A的最可能购买点,之后购买概率衰退,最好在30天前的那一周发送电子邮件提醒刺激。如果太早提醒还没发现,太晚又错过了。因此在适当的时机,营销才能事半功倍。
DT学院:预测性营销的选择方案有哪些呢?这里的开发用到哪些技术和工具?
董飞:关于预测营销的技术能力,有几种选择方案:1.使用预测分析工作平台,然后以某种方法将模型输入活动管理工具;2.以分析为动力的预测性活动外包给市场服务提供商;3.评估并购买一个预测营销的解决方案,比如预测性营销云和多渠道的活动管理工具。如下是我工作中常用的技术工具:
但无论哪条路,都要确定三项基本能力:
2.分析客户提供的数据,使用系统和定制预测模型,做高级分析。
DT学院:营销领域有哪些预测模型?
§参与倾向模型预测客户参与一个品牌的可能性,参与定义可以多元,比如参加一个活动,打开电子邮件,点击,访问某页面。可以通过模型来确定EDM的发送频率。并对趋势做预测,是增加还是减少活动。
§钱包模型就是为每个客户预测最大可能的支出,定义为单个客户购买产品的最大年度支出。然后看增长模型,如果当前的总目标市场比较小,但未来可能很大,就需要去发现这些市场。
§价格优化模型就是能够去最大限度提升销售,销量或利润的架构,通过价格优化模型为每个客户来定价,这里需要对你想要的产品开发不同的模型,或者开发通用,可预测的客户价格敏感度的模型,确定哪一块报价时对客户有最大的影响。
§关键字推荐模型关键字推荐模型可以基于一个客户网络行为和购买记录来预测对某个内容的喜爱程度,预测客户对什么热点,爆款感兴趣,营销者使用这种预测结果为特定客户决定内容营销主题。
§预测聚集模型预测聚集模型就是预测客户最终会归为哪一类。
DT学院:目前对于预测性营销技术,国际上有哪些技术创新和开发工具?目前的使用瓶颈和顾虑是什么?
大多数市场营销人员还是这方面能力不足,没有工程师和商业分析师的支持的话,就要从头做重复劳动,选择适当模型,去解决商业问题。而数据科学家往往也局限在某个行业内,找到合适的人才非常难,也很难跨行业获得经验。
DT学院:机器学习技术在预测营销领域是如何应用,会有怎样的发展?
董飞:去年人工智能特别火,特别是深度学习在机器视觉,语言识别,游戏AI上的突飞猛进,以至于人们开始恐慌人工智能是不是已经可以接管人类工作,我个人是对新技术有着强烈的兴趣,也非常看好新科技,数据与现实的关联。
“中国大数据技术先锋108将”高端人物访谈启动现诚挚邀约中
“中国大数据技术先锋108将”高端人物访谈活动已经启动,欢迎全国致力于大数据技术推广与传播的技术精英、专家学者自荐或推荐,共同推动大数据技术的发展与进步。
“中国大数据技术先锋108将”高端人物访谈工作组
联系人:Alisa
DT学院,是一家有温度、有态度的大数据资讯媒体。面向大数据产业的垂直资讯媒体和立体化服务平台,观察国内外大数据行业产业链的动态发展,发现行业内具备创新与潜力的公司与产品,捕捉中国及海外新锐前沿的观点和信息,提供优质大数据课程和就业猎头推荐,为大数据人提供对决策、技术、知识深造、职业发展等全方位服务。