电商系统之推荐系统

推荐一直是电商平台的重要流量入口。以往在电商平台上,推荐的场景更多的覆盖在交易的各个环节,比如详情页、购物车、订单及支付等。近年来推荐发展逐渐的多样化,场景上逐渐覆盖到各流量入口,推荐的实体也扩展到活动、类目、运营位等。

在电商网站里进行商品推荐,可以提高整个网站商品销售的有效转化率,增加商品销量。通过用户已经浏览、收藏、购买的记录,更精准的理解用户需求,对用户进行聚类、打标签,推荐用户感兴趣的商品,帮助用户快速找到需要的商品,适时放大需求,售卖更加多样化的商品。甚至在站外推广时,能够做个性化营销。

平台前端实现用户千人千面,而后台需要建立复杂的用户行为数据采集、数据存储、数据建模和用户画像过程,单纯采集某一纬度的数据,仅能达到个性化推荐的部分效果,如果要提升个性化推荐的效果,就必须覆盖用户多领域足够全面的行为轨迹,甚至用户线下行为,这就形成了以互联网电商平台为核心的生态系统,要想建立全面的个性化推荐,数据采集的涉及领域需要足够广,足够深。下面从用户画像、数据采集、数据存储、数据建模讲解个性化推荐的难度。

1用户画像

用户画像是通过用户兴趣、行为、自身属性建立的一个模型。通过对用户的调研、对用户行为的分析,结合业务的需求,将用户分为不同的群体;然后在群体中抽象出一些典型的特征,用结构化的信息记录下来,概括出用户的特征。根据用户画像标签体系,对访问平台的用户计算行为特征值,用户特征提取并不是针对所有的标签维度,对于优先关键标签,如果从用户数据库查询不到特征值,就需要调用R函数对其进行计算,最终得出每个标签维度的特征值,依据特征属性值,就可以对用户进行画像处理。

用户画像有其自身的特性和局限性,例如无法100%地描述一个人,且具有时效性,因此,需要根据用户画像的基础数据持续更新和修正,同时要善于从已知数据中具象化出新的标签使用户画像越来越鲜活立体,发挥其参考指引价值。

1.精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;

2.用户统计,比如热销商品top100品牌;

4.效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务;

5.私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。

6.行业分析,业务经营分析以及竞争分析,影响企业发展战略。

2数据采集

首先需要在网站和移动App中进行埋点,在页面埋入『隐形』探针,采集用户行为数据和业务系统操作日志、从数据库中提取业务数据,采集回来存储在数据服务,采集服务器组负责将采集到的日志信息生成文件,落地到存储设备,用户行为数据采集基本上采用SDK方式;ETL服务器负责将日志文件和结构化数据导入数据存储分析集群,并将分析结果导出到数据库;数据解析服务器负责连接数据分析服务器,完成数据分析各项计算;存储服务和分析服务提供数据分布式存储和计算的基础框架。

用户行为数据的处理和分析具有较高的技术门槛:

1、SDK会采集到大量的"脏数据",包含一些空白区域和特殊符号,甚至根本没有见过的数据类型,这些脏数据的处理和分析具有较大的技术挑战,特别是数据的实时采集和处理。通常技术人员只有经历了海量数据采集和处理,填平了大量"技术坑"之后,才能形成成熟的技术架构。

2、采集的数据都是以渠道、日期、地区统计,无法定位到具体每个用户,计算统计出的数据都是规模数据,针对规模数据进行挖掘分析,无法支持,数据无法支撑系统做用户获客、留存、营销推送使用。

所以,要使系统采集的数据指标能够支持平台前端的个性化行为分析,必须围绕用户为主线来进行画像设计,在初期可视化报表成果基础上,将统计出来的不同规模数据,细分定位到每个用户,使每个数据都有一个用户归属。将分散无序的统计数据,在依据用户来衔接起来,在现有产品界面上,每个统计数据都增加一个标签,点击标签,可以展示对应每个用户的行为数据,同时可以链接到其他统计数据页面。

3数据存储

用户行为数据采集后,需要存储在数据仓库,对采集的原始数据进行ETL加工处理,首先需要处理掉存储的无效重复数据,对于用户行为没有影响或重复数据,对非结构化数据和半结构化数据进行结构化处理,并对数据进行补缺、替换、数据合并、数据拆分、数据加载和异常处理。

4数据建模

用户模型的表示方法有4类:协同过滤模型、行为规则的模型、基于概念的用户兴趣模型与向量空间模型。向量空间模型(VSM)是最为常用的用户模型表示方法之一,通常使用一组向量值描述用户特征,向量的每一个维度代表用户感兴趣的一个主题。

维度的提取往往与网站系统的数据特征有关:在标签系统中,特征维度往往由用户提供的标签表示;在检索系统中,特征语词来自分析系统页面后所得到的关键词;在协同过滤系统中,可以把项目认为是描述用户特征的维度。使用VSM构建用户行为模型的困难是,数据中并没有明确表示信息行为的词语,所以在构建描述信息行为的维度时,需要从数据中抽象出描述信息行为的维度。

个性化推荐系统一般有三大环节:预处理->召回->排序。

注:也可以认为是两层(召回->排序)

预处理

第一个环节是预处理,预处理指的是对各种数据源的数据进行特征提取和特征构建,例如:内容特征提取,用户行为画像构建。

召回

第二个环节是召回,召回就是把预处理产生的特征作为输入参数,训练出推荐模型,然后使用推荐模型得出候选集合的过程。常用的召回方式有:基于内容推荐、基于协同过滤推荐等。

排序

第三个环节是排序,简单来说就是将候选集合根据一定的规则,例如:点击预估、匹配关联度、人为权重等进行调整,从而影响最后的推荐顺序。

推荐数据流

概念

LR:逻辑回归模型(LogisticRegression,LR)

GBDT:梯度提升决策树(GradientBoostingDecisionTree,GBDT)

推荐系统的整体工程架构如下图,从下至上包括离线计算层、实时计算层、在线服务层,另外是后台配置管理系统和数据调度服务。

在线服务:排序系统、推荐引擎、ABTEST实验、推荐投放等;

实时计算层:根据用户实时行为,提取用户实时特征、在线模型训练。

在线服务

系统分成推荐投放系统、排序系统、推荐引擎、abtest、字段补全服务等。

推荐投放

投放框架的功能如下:

1.提供统一的推荐接口。

2.各个场景的召回策略规则,可热部署。

3.提供通用数据源接口、工具类,方便算法推荐规则编写。

4.算法实验以及埋点统计。

5.推荐辅助工具。

推荐投放架构图

服务API调用统一投放接口获取推荐数据,投放接口解析请求参数,组装成下游推荐策略参数,对返回的推荐结果,拼装打点参数。为了实现推荐算法的在线对比,接口实现中接入了AB实验系统,它根据指定策略将上游请求按指定比例进行分流,通过实验配置,灵活控制不同流量的实验策略,算法工程师在线试验多个算法效果,极大的提升了推荐算法的迭代速度,优化推荐效果。

推荐策略模板是整个推荐投放服务实施的核心,监听动态配置服务,通过配置参数变更来驱动各类模板更新,迭代业务。推荐策略流程:入参补全->数据召回->精排->格式化->推荐数据补全。入参扩展模板,对入参做补充、修改,简化业务逻辑实现;业务模板,实现推荐策略主逻辑,由各类召回组件模板和精排调用组成(可选),一个业务模板中可以包含多个召回组件模板,组成数据召回链(实时点击偏好->离线偏好->店铺偏好->类目偏好->...);数据组件模板,通过配置从不同的数据源召回和过滤数据;数据补全模板,按业务模板召回的推荐数据项ID补全详细的字段值;格式化模板,根据展现层样式需求,将推荐结果封装成展现层可加载渲染的数据格式。对于已实现的推荐策略和能够使用现有模板组装的推荐策略,都可以在动态配置服务平台上通过配置发布快速实现业务迭代和新增,一定程度上实现了代码简化,提高业务开发迭代效率。

推荐策略

推荐存储

主要承载了用户特征以及离线推荐结果集,存储系统对读写性能要求非常高。

1.整条推荐链路希望在50ms-100ms内完成。一次复杂的推荐请求会请求上百次(以存储中的key为单位)存储数据,存储需要在1ms内返回。

2.对时延要求比较高,比如需要收集用户的曝光行为数据做降权,同时曝光数据的量非常大,对内存有挑战。

排序系统

排序系统的职责是对候选集进行排序,其中核心点在于模型和特征,理想情况下系统尽可能支持多的模型和特征,但是在线计算需要较小的时延,这就要求系统要平衡效果和性能,前期推荐系统可以支持LR和GBDT两种排序模型。

线性模型公式

x是特征,θ是权重,一个模型通常有几十维特征,这些特征的计算和存储就成为系统最大的挑战。

1.控制候选集数量在千级别,候选集增长整体计算就比较慢,rt也会上升。

2.实体(商品)特征本地存储,每次需要排序特定数量商品,本地存储可以极大缓解网络压。

4.并行计算,复杂模型下,组装特征和计算还是比较费时,为了提升rt系统进行并行计算,充分利用cpu的资源,在系统容量不变的情况下提升rt。

THE END
1.SSM网站图书商城964h9(程序+源码+数据库+调试部署+开发环境)本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。 系统程序文件列表 开题报告内容 一、项目背景与意义 随着数字化时代的到来,线上购物已成为人们日常生活中的重要组成部分。图书作为知识与文化的载体,其销售模式也逐渐向线上转移。开发一个网站图书商城系统,不仅能够为https://blog.csdn.net/Kittyxia001/article/details/144322328
2.网上购书哪个平台好,权威说明解析8DM92.81.83生活当当网作为中国最早的图书电子商务网站,拥有丰富的图书资源,以下是其优势: 1、图书种类丰富:当当网图书种类齐全,涵盖各类畅销书、经典著作、教辅教材等。 天猫作为中国最大的综合性电商平台,图书种类繁多,以下是其优势: 1、图书种类丰富:天猫图书种类丰富,包括各类畅销书、经典著作、电子书等。 http://good.junweilai.cn/post/17897.html
3.红袖读书惊爆信息:全新上线的AI智能推荐系统助力百万用户找到心仪该推荐系统通过分析用户的阅读历史、偏好和行为模式,为每位用户量身定制个性化的书籍推荐。这一过程涉及复杂的数据挖掘与机器学习算法,使得系统能够不断优化其推荐效果。根据相关研究显示,个性化推荐不仅可以提高用户满意度,还能显著增加平台的使用时长(Smith et al., 2020)。这种基于数据驱动的方法使得每位读者都能在浩http://ty.ssqf.vip/sqfzx/3934.html
4.关于网上买书的正规网站推荐及快速解答方案解析——桌面款56.483、京东图书 京东作为国内最大的电商平台之一,其图书业务也颇具规模,京东图书资源丰富,品质有保障,价格实惠,京东还提供了快速的物流和良好的售后服务,让消费者购物无忧。 快速解答方案解析 1、如何快速搜索书籍? 在各大网上书店的搜索框中,输入书名、作者或关键词,点击搜索即可,部分网站还支持语音搜索,更加方便快捷。http://hnspacenet.com/post/47637.html
5.《玩转电商系统:深入剖析智慧电商平台》(韩军编著)简介当当网图书频道在线销售正版《玩转电商系统:深入剖析智慧电商平台》,作者:韩军 编著,出版社:电子工业出版社。最新《玩转电商系统:深入剖析智慧电商平台》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《玩转电商系统:深入剖析智慧电商平台》,就http://product.dangdang.com/23582793.html
6.网上书店十大排行榜网上书店有哪些2024年网上书店十大品牌最新发布,网上书店排行榜前十名品牌有京东、当当、天猫、文轩网、博库网、新华书店、拼多多、抖音电商、中图网、孔夫子旧书网。网上书店10大品牌排行榜由品牌研究部门收集整理大数据分析研究得出,帮助你了解买书网站有哪些。https://m.maigoo.com/maigoo/1223wssd_index.html
7.打造高效可靠的书籍推广系统一个高效的书籍推广系统应该具备以下功能与特性: 1. 精准的目标受众定位 通过分析用户的浏览记录、购买记录和行为数据等,实现精准的目标受众定位,从而提高系统的推广效果和ROI。 2. 个性化推荐 基于用户的偏好和行为,利用机器学习和数据挖掘算法,实现个性化的图书推荐,提高用户的购买满意度。 https://www.506064.com/n/237161.html
8.电子商务网站研究(精选十篇)5、基于信息构建的评价方法。是一种从信息内容组织功能的角度进行网站评价的方法, 即将网站的组织系统、全局导航系统、局部导航系统、语境导航系统、补充导航系统、检索系统和标识系统等七大系统要素纳入评价范围。 6、基于消费者行为的网站评价方法。此类方法从消费者认知的角度出发, 把消费者作为电子商务网站的起点与终点https://www.360wenmi.com/f/cnkey10oqkxt.html
9.Python全栈工程师MOOC中国项目五:电商商城产品口碑分析 项目亮点:综合性;强有机整合web开发、爬虫技术、数据分析可视化 项目六:书城图书推荐系统 项目亮点:根据网站后台数据开发图书推荐模型;针对不同用户推荐不同的图书;掌握算法 毕业项目:在线影院推荐系统 项目亮点:综合实战,要求高;全面检阅全栈应用能力 https://www.mooc.cn/course/14712.html
10.电商网站建设:图书行业的数字化转型网站建设网站设计响应式设计:商城网站在PC端、移动端均能良好适配,确保无论顾客使用何种设备,都能获得一致且流畅的购物体验。 高效商品展示:图书类商品种类繁多,商城设计能够通过高效的分类、搜索及推荐系统帮助顾客快速找到所需图书,提升购买转化率。 多种支付方式:支持主流的支付方式如支付宝、微信支付、信用卡支付等,便捷的支付体验https://www.vikj.cn/hangye/12135.html
11.降价促销玩不转漫谈电商网站转型之路大数据时代的来临,让人们意识到数据的价值。电商网站能够产生非常多的数据,而且这些数据往往更具有分析价值。无论是个人注册信息、购买商品的信息、浏览网页的信息、交易的信息等等,这些都可以用来分析,从而为企业发展指明方向。 精准推荐系统就是大数据分析的一个非常经典的使用案例。亚马逊通过自己研发的精准推荐系统每秒卖https://m.zol.com.cn/miparticle/3465145.html
12.三味图书电商系统app:阅读新体验综上所述,三味图书电商系统app以其丰富多样的书籍资源、便捷的购买流程、个性化的推荐系统、高品质的阅读体验、社交化的互动交流以及智能化的书单管理,为读者带来了全新的阅读体验。这不仅满足了读者的阅读需求,也提高了阅读的趣味性和互动性。相信在未来的发展中,三味图书电商系统app将继续发挥其优势,为读者带来更多优https://www.sousou.com/bk/772256.html
13.图书电商数据图书电商数据API接口免费API接口聚合数据图书电商平台可以使用该接口获取图书的基本信息、价格、销量、评论等数据,为用户提供全面的图书信息,提升购物体验和销售效果。 图书推荐系统 基于该接口的数据,可以开发图书推荐系统,根据用户的兴趣和行为,推荐符合其偏好的图书,提高用户满意度和购买转化率。 https://www.juhe.cn/docs/api/id/50
14.亚马逊平台介绍,什么是跨境电商亚马逊资讯另外,当客户再次登录亚马逊网站时,之前浏览过的产品仍会被展示,继续对他进行提醒和刺激,很多客户也在这样的刺激下做出了购买决定。凭借着这样的算法和技术,亚马逊在业内有着“推荐系统之王”的美称,据统计,亚马逊有35%的销售额都与推荐系统相关。 2、重展示,轻客服 https://www.youlechuhai.com/news/1388645537826209794
15.合肥快鲸科技有限公司:微信营销系统,多商户电商分销系统快鲸新零售电商系统平台隶属于安徽小猪科技有限公司,是小猪开发团队通过五年的产品积累形成的以顾客会员为中心的电商系统平台,致力于为零售业提供专业的营销应用和解决方案。详细介绍 最新产品更多产品信息 电商平台商品推荐系统设计的关键注意点 O2O商城系统开发怎么选择? http://95341074.b2b.11467.com/
16.电子商务个性化推荐系统对消费者购买意向的影响研究电子商务个性化推荐系统对消费者购买意向的影响研究,技术接受模型,个性化推荐系统,购买意向,电子商务,个性化推荐系统是互联网和电子商务发展过程中的产物,是一种高级的商务智能平台。个性化推荐系统基于海量的用户和产品信息对数据进https://wap.cnki.net/touch/web/Dissertation/Article/-1019702669.nh.html
17.电商推荐系统架构51CTO博客项目以推荐系统建设领域知名的经过修改过的中文亚马逊电商数据集作为依托,以某电商网站真实业务数据架构为基础,构建了符合教学体系的一体化的电商推荐系统,包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务https://blog.51cto.com/u_15278282/3907647
18.基于Mahout的个性化推荐系统1系统设计将详细介绍整个系统架构、数据模型建立、推荐结果、执行计算、呈现结果设计等各部分的设计。 本推荐系统是基于电商平台进行设计开发,对于其它领域比如电影推荐、图书推荐同样适用。 二、相关技术介绍 1、Apache Mahout Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可https://hacpai.com/article/1561799936858
19.电商营销解决方案智能推荐系统· 智能异常监测系统 · 自动化的绩效监测平台 智能电商营销云平台解决方案 · 适用于网站/APP/微信/微博整合营销的智能推荐系统 · 智能电商客户数据平台 · 智能电商平台与CMS系统整合 · 智能电商平台与CRM系统整合 · 智能电商平台在云平台的部署 · 适用于网站/APP/微信/微博整合营销的智能电商营销云平台的定https://www.merklechina.cn/ecommerce-service-solution.html