智能推荐根据不同的行业提供了归档的如下几类算法模型,您可以通过在线实验平台的实验参数配置针对性的进行开启或关闭以及具体算法子类型的优化。
协同过滤算法主要分为基于物品的协同过滤算法、基于用户的协同过滤算法。
目前智能推荐在协同过滤链路中主要以基于物品的协同过滤算法为主。
基于物品的协同过滤算法实现步骤:
基于传统CF协同过滤的协同过滤算法,是一种基于关联规则的算法。
例如,当用户反馈在首页推荐中看到的物品种类比较少的时候,可以考虑适当提升此召回链路的优先级。
即基于Swing的i2i算法,Swing是一种基于图结构计算商品相似度的算法,以高维的网络结构向二跳节点扩展,抗噪能力强,相比传统的CF准确性有较大的提升。
限制叶子类目的传统CF协同过滤的i2i算法,即只召回和当前triggeritem叶子类目一致的相似物品。
在基于物品协同过滤的基础上增加了叶子类目的限制,更突出和之前行为例如点击物品的叶子类目一致性。
例如用户点了口红之后,希望下一次请求实时推荐口红,适用该链路。
限制一级类目的传统CF协同过滤的i2i算法,即只召回和当前triggeritem一级类目一致的相似物品。
在基于物品协同过滤的基础上增加了一级类目的限制,更突出和之前行为例如点击物品的一级类目一致性。
例如用户点了口红之后,希望下一次请求实时推荐其他美妆类物品,例如粉底,适用该链路。
限制渠道的传统CF协同过滤的i2i算法,即只召回和当前triggeritem(用户行为关联的物品,例如点击行为的点击物品)channle一致的相似物品。
在的基础上增加了渠道的限制,更突出和之前行为。
例如点击物品的渠道一致性。例如在新闻行业,用户点了财经新闻之后,希望下一次请求实时推荐财经新闻物品,适用该链路。
各类用户偏好二阶传导召回链路
用户偏好类目二阶传导:
基于终端用户历史行为,推算终端用户的偏好类目寻找相似物品的算法。
相对于协同过滤,更聚焦用户对于物品类目偏好。需要强依赖客户上传的行为数据和物品类目等信息,需要按数据规范要求上传行为以及物品类目信息。
用户偏好标签二阶传导:
基于终端用户历史行为,推算终端用户的偏好物品tag,寻找相似物品的算法。
相对于协同过滤,更聚焦用户对于物品tag偏好。需要强依赖客户上传的行为数据和物品tags等信息,需要按数据规范要求上传行为以及物品tag信息。
用户偏好渠道二阶传导:
基于终端用户历史行为,推算终端用户的偏好物品渠道,寻找相似物品的算法。
相对于协同过滤,更聚焦用户对于物品渠道偏好。需要强依赖客户上传的行为数据和物品渠道等信息,需要按数据规范要求上传行为以及物品类目信息。
用户偏好作者二阶传导:
基于终端用户历史行为,推算终端用户的偏好作者,寻找相似物品的算法。
相对于协同过滤,更聚焦用户对于物品类目偏好。需要强依赖客户上传的行为数据和物品作者等信息,需要客户按数据规范要求上传行为以及物品类目信息。
用户偏好店铺二阶传导:
基于终端用户历史行为,推算终端用户的偏好店铺,寻找相似物品的算法。
相对于协同过滤,更聚焦用户的店铺偏好。需要强依赖客户上传的行为数据和物品店铺等信息,需要按数据规范要求上传行为以及物品店铺信息。
用户偏好品牌二阶传导:
基于终端用户历史行为,推算终端用户的偏好品牌,寻找相似物品的算法。
相对于i2i,更聚焦用户的品牌偏好。需要强依赖客户上传的行为数据和物品品牌等信息,需要按数据规范要求上传行为以及物品品牌信息。
用户偏好机构二阶传导:
基于终端用户历史行为,推算终端用户的偏好机构,寻找相似物品的算法。
相对于协同过滤,更聚焦用户对于物品的机构偏好。需要强依赖客户上传的行为数据和物品机构等信息,需要按数据规范要求上传行为以及物品机构信息。
全局行为热度召回:
智能推荐可以根据站内用户行为分析、兴趣分析,结合新品特征属性,小流量个性化探测新品潜力,从而逐渐扶持或打压新品的推荐流量。
各类新品算法召回链路:
基于用户偏好类目新品扶持:
基于用户偏好品牌新品扶持:
基于用户偏好店铺新品扶持:
基于用户偏好标签新品扶持:
基于用户偏好渠道新品扶持:
基于新品综合行为热度扶持:
基于用户行为序列向量召回:
当前算法会根据用户点击序列商品作为输入,计算物品向量,计算物品之间的相似度或者用户对于物品兴趣程度,较传统i2i算法有更好的泛化性。
基于word2vec算法,共同用户行为越丰富,item间向量越相近。相对于I2I,可建模高阶相似度,从而提升召回覆盖率。适合item行为丰富的场景。相对于对i2i算法,此算法对于行为丰富度要求更高,比较适合行为丰富的业务场景。
基于标签向量召回:
基于item的tag的向量召回,通过向量描述物品各种tag,计算物品之间的相似度或者用户对于物品兴趣程度,较传统i2i算法有更好的泛化性。
基于物品tag的语义内容理解,推算物品的特征向量,所以对于tag质量要求比较高,如果物品tag的质量较好,可以考虑提升当前链路的优先级。
基于标题向量召回:
基于item的title的向量召回,通过向量描述物品标题,计算物品之间的相似度或者用户对于物品兴趣程度,较传统i2i算法有更好的泛化性。
基于物品标题的语义内容理解,推全出物品的特征向量,所以对于物品标题的质量要求较高。如果物品的标题质量较好,可以考虑适当调整当前链路的优先级。