搜索策略产品必读系列—第一讲电商搜索引擎整体框架app词库淘宝

现在市面上太多人聊推荐,关于推荐的书也有很多很多。

搜索聊的人却很少很少,但是搜索在很多场景中对于流量的转化远远超过推荐,搜索转化的提升对于业务的增长要远远超过推荐。

一、电商APP搜索引擎是什么

首先确定一下我们聊得搜索并不是Baidu、Google这种综合搜索引擎,而是像淘宝、京东、美团这类电商APP里面的搜索引擎。

1.用户的Query复杂度差异较大

用户使用综合类搜索引擎Query的复杂度很高,很多时候是一种探索式的搜索,比如用户搜“经典电影”,百度会首先返回百度自身推荐的经典电影,然后后面会有大量含“经典电影”字样的帖子。很多时候用户的Query甚至是一种描述性的语句比如“含有爱情的诗句”。

而电商APP里的搜索引擎因为场景固定,用户搜索目的性很强,Query意图比较明确如“男鞋”、“长裤”、“可乐”等,一方面用户目的性强,另一方面用户也知道该场景下Query过于探索是不会有结果的,用户有一定的认知判断。

所以综合类搜索引擎需要对用户的搜索意图识别的很准确,而电商场景的搜索引擎会相对要求低一些。

2.搜索结果池差异太大

二者背后存储的数据多样性差异很大,体量差异更大。

电商APP搜索引擎搜索的结果一定都是呈现在APP上的。但是综合类搜索引擎完全不是,搜索结果来自于各大网站,很多结果是外部链接。内容形式各种各样:视频、文字、音频等等。

综合类搜索引擎背后存储着大量的数据,同时数据在不停地增加和更新。而电商APP搜索引擎背后的数据池都仅限于该APP上的商品,即使商家不停地上下架商品,整体数据量和综合类搜索引擎差距也是巨大的。

二、电商APP中的搜索引擎为什么重要

那么我们为什么说电商APP中的搜索引擎特别重要。

一方面随着网上购物消费群体的多样化以及年轻人不断增强的自主意识,用户已经从传统的“被动”接受网站推荐的商品信息,转变为“主动”去发现商品,发掘自己感兴趣的商品。

那么APP中的搜索功能就成为了非常重要的功能,能否识别用户的意图并且准确地返回相应的商品就十分关键。

另一方面数据显示:

1.综合电商APP

搜索引擎占据的销售归因目前普遍在60%以上,搜索占据淘宝的销售归因约为70%左右。

销售归因即为该平台上各个流量转化入口如:搜索入口、分类页入口、首页推荐入口等对最终的销售贡献占比。通过上面的数据我们可以清晰地得出搜索目前对于整个业务流量的转化贡献是最大的。

在综合类电商APP刚刚开始时,最大的销售归因模块是分类页,也就是我们看到淘宝上的“女装”、“手机”、“男装”等模块,但现在已经是搜索入口贡献着最多的流量转化。

2.生鲜电商APP

搜索入口占据的销售归因目前普遍在35%-40%左右。

生鲜电商APP为像盒马、叮咚买菜、每日优鲜这类专门卖生鲜为主的APP。因为生鲜电商整体商品相对于综合电商APP少很多,用户每日在APP上面买菜,除了搜索入口,分类页也占据着生鲜电商APP非常大的销售归因,几乎和搜索入口一样也在35%-40%左右。

通过上面的数据我们可以直观地看出搜索功能对于电商APP流量的转化起到多大的作用。

同时我们再算一笔账:

2019年淘宝全年成交金额为5150亿美金,假设其中70%是由搜索转化的,也就是说3605亿美元是由搜索入口转化的。

那么如果我们通过提升搜索体验,丰富搜索辅助功能等,将70%的搜索销售归因转化净提升1个点到71%。

淘宝全年的销售额将增长51.5亿美元,这是一个什么概念?2019年叮咚买菜全年销售额为50亿RMB,大概是7个叮咚买菜的体量。所以互联网企业都在大力提升搜索的转化率,转化率每一个点的提升,带来的都是全年业务量的巨大增长。

三、搜索的整体框架

介绍完搜索的重要性,那么我们如何去提升搜索的转化率,如何去搭建一个搜索引擎,在电商APP中的搜索引擎整体框架到底是怎么样的了?我们用下图来进行表示:

下面我们针对上图中的每个模块一个一个进行详细介绍。

1.分析器

分析器的作用就是对用户的Query进行处理,进行纠错预处理后,然后再进行切词、拼音转汉字、去停用词等,最后将整个Query分成单个词组合以后再进行实体识别。

比如用户输入了“kangshifu红烧方便面*%”,

1)切词

先对整个query进行切词,切分为“kangshifu”、“红烧”、“方便面”、“*”、“%”。切词这部分功能工业界有一些通用的切词器,比如ik切词、hanlp切词器,但是我们实际使用时都会再加入更多的词库进行切词,不仅仅是使用现成的切词器。

2)拼音转汉字

再将拼音kangshifu转化为康师傅;

3)去停用词

将“*”、“%”没有任何意义的停用词去除掉;

4)实体识别

最后对剩下的“康师傅”、“红烧”、“方便面”进行实体识别,我们不仅需要把固定搭配的词切分出来,我们还需要知道这些词代表的实体含义,最终得到【Brand:康师傅;Taste:红烧;SPU&CATEGORY:方便面】。很多词汇并不是只有一个实体,比如这里的“方便面”,它既是一个SPU又是一个CATEGORY。

2.词库

上面提到的一系列操作都离不开词库,没有词库分析器寸步难行。我们知道“kangshifu红烧方便面%”里面的kangshifu应该是“康师傅”,然后Query的断句应该是“康师傅”、“红烧”、“方便面”而不是“康”、“师傅”、“红”、“烧方便面”,就因为我们已经对这些词汇固定搭配有了一定知识积累,同时“*%”对于查询是没有任何意义的,也是基于我们历史的词汇和知识积累。

但是计算机不知道,我们如何让计算机知道“康师傅”是一个固定搭配,同时它是一个Brand,这就需要我们建立各种各样的词库了。

电商APP搜索引擎中词库是非常重要的,第一词库全不全,第二词库准不准。不同行业不同领域会有自己专门的词库,大部分词库都不是通用的。下图是阿里云Opensearch建立的电商行业的实体词库类型。

但其实还有很多实体词库类型需要补充,比如生鲜电商业的SPU、口味、包装等。同时还会存在大量的同义词库、近义词库、纠错词库、拼音词库等等。

计算机如何知道用户搜索“圣女果”和“小番茄”是一种东西,这就需要同义词库。

同义词库需要大量的积累,尤其是在生鲜电商领域,同样一种菜,全国各地叫法都不一样,但是对应的是同一种菜。同时还存在同一种叫法,对应的是不同种食物,比如“珍珠米”在上海就是玉米粒,在东北是一种大米。

所以词库的建立是必不可少的,同时又是一个需要长久积累,且持续更新不断细化的过程。

3.Recall&Elasticsearch索引

当我们将“kangshifu红烧方便面*%”经过分析器处理后,得到【Brand:康师傅;Taste:红烧;SPU&CATEGOY:方便面】后,我们需要构建召回条件,就是用上述哪些实体去物料库中进行召回。

1)物料库结构化梳理

召回的基础就是电商APP的搜索针对的物料是固定的,也就是当前APP上架的所有商品,背后对应的就是整个APP物料库。在最开始时我们就需要对整个物料库进行结构化梳理,数据库里面存储的是结构化数据,而不只是一个商品名“康师傅红烧牛肉面100g”。

结构化数据如下图:

目前业内通用的分布式搜索引擎是Elasticsearch,查询速度很快。结构化的物料数据都存储在Elast

2)召回条件构建

【Brand:康师傅;Taste:红烧;SPU&CATEGOY:方便面】通常情况下我们会将实体之间通过and关系去物料库中进行召回,但上述“方便面”存在两个属性,所以会两个属性分别去进行召回。

同时我们也会加入同义词,构建新的召回条件,比如“方便面”的同义词存在“泡面”,同时同义词性是在SPU这个实体下存在的,所以我们会再构建一个召回条件【Brand:康师傅;Taste:红烧;SPU:泡面】。

在生鲜电商中召回条件构建比较简单,但在综合电商中比如用户搜索【王一博同款白色卫衣限量版】,我们就需要拆分召回条件,如果用【王一博and同款and白色and卫衣and限量版】去索引中进行召回,可能召回的结果就会很少。

所以我们需要重新构建召回条件,进行Query改写,挑选比较重要的条件去召回,其他条件忽略。我们可以将Query改写为【王一博and白色and卫衣】所以实体与实体之间是存在优先级的,有些实体属性是要优于其他实体属性的。

最终我们召回得到搜索结果。

4.Ranking

召回的搜索结果如何进行排序了,一般我们从以下两个方面进行考虑:

2)业务规则排序

通常情况下第一种和第二种我们是综合在一起进行加分,然后再对商品进行综合排序。

3)机器学习模型

通过历史用户的点击、购买、收藏、加购数据等,构建机器学习模型,然后模型来进行千人千面的排序,这也是目前市场上主流电商APP的做法,每个人搜索同一个词,看到的结果是完全不一样的,

上述整体地介绍了召回和排序模块,实际应用中召回和排序模块还有很多细节,后续我们会专门再对这两个模块进行详细介绍。

5.Reranking

上述是一些通用的规则或者模型排序策略,实际业务方还会有一些其他要求,比如最近业务方在对“康师傅”牌的方便面做市场推广活动,那么在用户搜索“方便面”时,业务方就希望我们将所有“康师傅”品牌的方便面排序在前。

所以很多时候Ranking的结果还需要经过一层Reranking再排序,这一层主要是业务策略的排序。

6.ABTest

上面就是一个电商APP搜索引擎通常的整体框架了。

四、搜索的效果评估

当我们将搜索引擎搭建好以后,如何去评估搜索引擎的好坏了?通过哪些指标去评估搜索的效果。

1.线下评估

线下评估对于搜索来说是最难评估的,当搜索引擎没有上线时我们如何去评估搜索引擎的效果好坏。这个时候我们需要构建测试case,并对这些测试case进行数据标注。

比如物料是【康师傅方便面、统一方便面、康师傅矿泉水、汤达人方便面】

那么Query=“方便面”时,我们可以标注为【2,2,-1,2】;

Query=“康师傅方便面”时,可以标注为【2,1,-1,1】;

这些标注都是人工进行标注的,标注员的标准不一样,可能整个结果完全不一样,所以最开始就需要大家统一好标准,很多时候我们是根据搜索引擎的策略进行标注。

1)召回率(评估召回结果是否齐全的指标)

用户搜“方便面”,只召回了“康师傅方便面”,那么召回率=1/3;如果三款方便面全部召回了,召回率=3/3=100%;

2)DCG&NDCG指标(评估排序是否合理的指标)

2.线上评估

线上我们可以使用很多种指标进行多方面效果评估,一般采用如下指标:

1)查询无结果率

评估召回效果,通常该指标越低越好,说明大部分搜索都是有结果的;

2)平均点击商品位数

评估排序效果,通常该指标越小越好,说明用户在结果页的前面就找到了自己感兴趣的商品;

3)CTR

点击转化率是综合评估搜索的效果,用户搜索后的点击情况,是否点击是由召回结果和排序情况共同决定的,CTR越高越好;

4)加购率

加购率也是综合评估搜索的效果,对于搜索结果是否加购,加购率越高越好;

5)跳失率

进入搜索结果页后用户是否没有任何操作就跳出了,如果该指标很高,说明用户对于搜索结果不满意和不感兴趣,跳失率越低越好。

上面就是电商APP智能搜索系列的第一讲了,主要给大家介绍了整体框架和评估体系,后续会继续推出:第二讲—如何召回搜索结果;第三讲—如何排序搜索结果;第四讲—搜索引擎的业务效果评估指标;第五讲—搜索结果的内容形式和创意形式,对很多模块进行更加细致的讲解~

本文由@KingJames原创发布于人人都是产品经理。未经许可,禁止转载。

THE END
1.卖货软件APP推荐卖货软件下载您可以通过我们的APP展示商品,发布促销活动,并与客户进行实时沟通。我们还提供了订单管理和数据分析功能,帮助您更好地了解销售情况和客户需求,从而做出更明智的决策。无论您是小型独立店铺还是大型企业,我们的卖货APP都能满足您的需求,提升销售效率和客户满意度。开始使用我们的APP,让您的销售更加高效和便捷!https://www.wandoujia.com/bangdan/1245206/
2.销售平台软件排行榜前十名偏玩手游盒子分享十大销售平台软件排行榜前十名手机应用,编辑为您推荐手机销售平台软件排行榜第一名到前5名到前十名的应用。找销售平台软件有哪些、销售平台软件哪个好用,上偏玩手游盒子https://m.pianwan.com/s/zj-1846913
3.电商app排行榜2023电商app有哪些?电商软件大全电商app是一款便捷购物新方式平台,给用户最便捷的购物渠道,最优惠的商品折扣,最有保障的品牌电商,让大家买的放心,用的舒心!绿色资源网为大家带来2023电商app平台排名和电商软件大全,如:手机淘宝、唯品会、亚马逊等电商购物app,一起来看看吧! 相关推荐:省钱购物app、超市购物app、电视购物app、分期购物app http://www.downcc.com/k/dianshang/
4.电商app有哪些?电商app排行榜2024电子商务软件网易严选app是一款能够花很少的钱买到国际大牌产品的购物平台,非常给力,从生产到销售都严格有人挑选,能让消费者买到最好的商品,真正享受性价比这个概念,有喜欢的朋友赶紧来 小米有品商城 132.09M / 2022-08-06 / v5.3.0 安卓版 评分: 下载 小米有品商城是小米专为用户们打造的一款手机电商平台,用户可以通过软件http://www.downyi.com/key/dianshangapp/
5.基于微信小程序和安卓的农产品线上销售购物商城APP网络的广泛应用给生活带来了十分的便利。所以把谷惠农产品线上销售与现在网络相结合,利用java技术建设谷惠农产品线上销售APP,实现谷惠农产品线上销售的信息化。则对于进一步提高谷惠农产品线上销售发展,丰富谷惠农产品线上销售经验能起到不少的促进作用。 https://blog.csdn.net/QQ123311197/article/details/126637816
6.银泰百货线上APP(喵街)涉嫌销售伪劣产品黑猫投诉2024年2月25日我通过线上下单购买一款安徽蚌埠银泰城耐克专柜直发的旅行包,在3月中旬第一次旅行使用,搭配的是同期在该平台购买的新百伦绿色运动裤,回来后发现包包与裤子接触面被渲染大片绿色,以为是裤子掉色,特意去裤子门店商品下做了评论。后4月中旬再次出行,身穿浅蓝色牛仔裤,途中发现包包与裤子接壤处出现大片蓝色https://tousu.sina.com.cn/complaint/view/17372740038
7.汽车营销的论文5.1 强化汽车营销服务的品牌服务产品观念 汽车服务营销的实施依赖各位员工,因此,企业首先应将服务营销理念植入各位员工心中,树立一线工作人员为顾客服务、后台人员为前台服务的全员服务观念,这样才能最终实现以消费者需求为起点、全员服务的营销观念。 5.2 汽车服务营销渠道品牌专营管理 不管是线上还是线下产品销售渠道还是产https://www.yjbys.com/bylw/qitaleilunwen/110412.html
8.员工多渠道线上销售,随时向客户推荐移动自有产品。刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供通过微店可提升线上销量实现自有员工多渠道线上销售,随时向客户推荐移动自有产品。A.正确B.错误的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转化https://www.shuashuati.com/ti/c7f7b44712ec49d99163f8fa11f6cace.html?fm=bdee26e470451d401dcb034ff93246a5c5
9.好兽药app下载好兽药app线上兽药销售平台下载v1.3.0平台经普莱柯集团及旗下3家子公司(洛阳惠中兽药有限公司、洛阳惠中生物技术有限公司、河南新正好生物工程有限公司)授权上架其自主研发兽药产品,APP实现同款产品比价格,同样价格选择更优产品功能 更新内容: 好兽药产品体验优化 下载地址 好兽药app线上兽药销售平台 v1.3.0 安卓版 https://www.itmop.com/downinfo/493799.html
10.4500+资源免费对接:乘风破浪的姐姐直播招商滴滴寻品牌实物我需要:有任何销售渠道的个人,组织。 我提供:我们公司提供专利产品,分润好谈,无需囤货 18、【魔方团运公司】提供互联网注册单、涨粉、实名认证、app: 我需要:注册单 我提供:推广app、注册单各类互联网项目 19、【伍食摄】提供电商美食拍摄: 我需要:希望有线上的电商类运营,或者线下直接客户联系我们,只要有资源https://www.niaogebiji.com/article-27383-1.html
11.品质管理OLAP:线上分析处理 (On-Line Analytical Processing) OLTP:线上交易处理 (On-Line Transaction Processing) OPT :最佳生产技术 (Optimized Production Technology) PDCA:PDCA管理循环 (Plan-Do-Check-Action) PDM:产品数据管理系统 (Product Data Management)) http://www.360doc.com/content/11/1119/22/8171852_165849805.shtml
12.线上药房APP源码丨在线药店系统源码丨药店商城商户入驻丨买药卖药3、线上买药 问诊开药、秒杀活动、开具处方、处方审核、药房发货、上传处方、选择症状、患者信息、视频处方图文购药、处方签名、即时通讯。 (可根据不同用户需求,单独定制模块添加) 三、万岳在线药房APP·产品优势 1、多种解决方案 适用多种需求、不同场景,实现“不止药房”:系统模式也支持同城买药、跑腿、代办、https://market.cloud.tencent.com/products/37279
13.旅游联合营销范文9篇(全文)移动互联更是席卷中国在线旅游业,大量旅行类APP和微信应用涌现,改变我们探索旅游目的地的方式、预订旅游产品的方式、进行旅途记录和分享的方式,在线旅游产业进入移动互联时代。 随着在线旅游的日趋完善,线上整合营销与传统旅游行业日益整合,共同催生了旅游行业线上营销普及化的新趋势。继2012年与去哪儿合作之后,2013年https://www.99xueshu.com/w/ikey5rttvmbo.html
14.头条文章7月14日,东方甄选App日前首次开启独立直播,最高在线人数达到了2.6万。7月13日,东方甄选App迭代更新,上线多个直播间,“东方甄选会员店”“自营产品”2个直播间,已开启同时直播。未来,东方甄选App将开启更多直播。同时,东方甄选APP上的新品首发和APP上的好物专享首次上线(抖音上买不到),不仅部分商品是APP专享,其售https://card.weibo.com/article/m/show/id/2309404924792695292040
15.年货促销营销方案(精选13篇)中展示、宣传推广的平台,旨在发挥电商新业态,催生新经济发展的'引擎作用,通过线上专区等推广方式,编织周至农特产品线上全平台销售密网,进一步强化了周至电商产业链条,助推乡村振兴提质增效。成为促进消费的新途径和商贸流通创新发展新亮点。重点打造新春线上促消费活动,方便我县居民进行无接触式年货采购,为我县居民提供丰https://www.ruiwen.com/fangan/6497560.html
16.财联社保险周报(9月7日)界面新闻9月3日消息,第十三届今日召开,贵州银保监局党委委员、副局长张曼红在中国保险业信息化峰会上表示,受疫情影响,保险业数字化转型进程进一步加快,未来保险+科技必将成为保险业发展的重要引擎,科技赋能成为保险业的关键词。她认为,线上化转型要坚守服务经济定位、加大产品创新、加强人才队伍建设、提高风险防控能力。 https://m.jiemian.com/article/4943142.html
17.超市春节备货方案范文(通用13篇)3.app线上宣传;由设计部负责: a、app产品美化; b、手机banner广告的制作; c、检查测试下单流程 4.媒体广告:百姓关注、952、户外媒体广告。 5.宣传视频:app视频、公司宣传视频。 6.公益宣传:为社区福利院、清洁工人、贫困家庭赠送年货,一是为了提升公司形象;二是借助媒体进行炒作。 https://www.wenshubang.com/fangan/2761611.html
18.小蜜蜂云工作远程灵活用工在家线上兼职人事外包服务网页设计,APP设计,艺术插画 短视频制作 视频剪辑,音频制作,动画制作 运营策划 新媒体,文案编辑,公众号运营 市场营销 SEO专家,社群营销,营销策划 客户服务 淘宝客服,在线客服,客服支持 远程实习 社群运营,新媒体,语言编辑 职能岗位 法务,会计,人事,翻译 https://www.xmf.com/
19.潜在周报:本周收录73起主要投融资事件,39起为A轮或者更早期投资Infinity Ventures Partners投资。ZOMAKE是一家面向全球市场的IP及设计师周边定制化产品商城,用户可以使用自己的图片对产品进行定制,或直接购买由其他设计师或IP品牌合作商所设计出售的成品;设计师及IP品牌合作伙伴可以通过ZOMAKE开设店铺,自选产品进行在线设计并上架销售,获得0成本投入的衍生品版税收入。 https://www.tmtpost.com/1694554.html
20.中国邮政集邮商城,邮你喜欢集邮频道为集邮爱好者提供邮票销售、集邮产品集邮文创产品销售、个性化定制等服务,海量正品任你选,在线下单,省时省力。https://jiyou.11185.cn/