美团外卖美食知识图谱的迭代及应用

知识图谱,旨在描述真实世界中存在的各种实体和实体之间的关系。在美团外卖业务中,美食商品是美团向用户提供服务的基础,美食知识图谱的建设,可以帮助我们向用户提供更加准确、更加丰富、更加个性化的美食服务。另外,美团外卖业务向用户提供“到家”吃饭的服务,到店餐饮业务则向用户提供“到店”吃饭的服务,而外卖和到店的商家和菜品有相当程度的重合,菜品数据的对齐,为我们进行线上(外卖场景)线下(到店场景)数据的对比分析也提供了一个很好的“抓手”。

外卖美食知识图谱包含以下四种维度的标签(以“宫保鸡丁”为例,如下图2所示):

菜品对齐,涉及到菜品数据,来自外卖在线菜品、点评推荐菜品、美团商家套餐等。

目前,外卖美食知识图谱已经应用于美团外卖的多个场景,例如推荐、搜索、套餐搭配、运营分析等。业务的深入发展,对美食知识图谱的建设和迭代也提出了更加复杂的要求,例如:

外卖美食知识图谱的迭代难点主要体现在以下几点:

菜品类目标签的挖掘,主要解决美食菜品是什么类别的问题。实现这一目标的挑战有两方面:首先是类目体系如何建立,其次是如何将商品链接到相应的类目节点。在最开始的体系构建时,我们从美食商品的特点以及业务的具体需求出发,从零开始建立起包含一百多种类别的层次化类别体系,部分实例如图3(左)所示。同时,构建基于CNN+CRF的分类模型,对美食商品进行类目分类,如图4(左)所示。

然而,随着业务的发展,已有分类目已经无法支持现有业务的需求。例如:原先的类目体系,对热菜描述不够详细,譬如没有区分热菜的做法等。为此,我们与外卖的供给规划部合作,将类目体系扩充到细分的三百多种类目标签,划分更加详细,覆盖也更加全面,部分实例如图3(右)所示。

类目的细分,要求模型更加精确。在进行类目识别时,可用的数据包括菜品名、商家店内侧边栏分类名称、商家名等。考虑到可使用的信息大多为文本信息,并且,商家录入的文本并没有一定的规范,菜品名也多种多样,为提高模型精度,我们将原先的CNN+CRF的分类模型进行了升级,采用模型容量更大的BERT预训练+Fine-Tuning的模型。模型结构如下图4(右)所示。

我们在建设主题属性时,首先在基础属性标签维度,综合考虑商品的销量和供给情况,对菜品进行选优。例如类目下的经典美食等。但在建设过程中,我们发现菜系的经典美食识别,假如依据销量和供给进行识别,则识别结果倾向于菜系下的“家常菜”,因此将经典菜系美食进行单独识别。

类目经典美食等指的是销量较高、供给量丰富的类目美食商品,例如主食经典美食、小吃经典美食。口味、食材、做法经典美食标签等也是相似的定义。

这里的健康餐主要指低脂低卡餐,即低卡路里、低脂肪、高纤维、制作简单、原汁原味、健康营养的食物,一般为蔬菜水果(如罗勒、甘蓝、秋葵、牛油果等),富含优质蛋白的肉类(如三文鱼、虾、贝类、鸡胸等),谷物(主要以粗粮为主,如燕麦、高粱、藜麦等)。烹饪方法也坚持“少油,少盐,少糖”的原则,主要做法为蒸、煮、少煎、凉拌等。

健康餐的识别,主要挑战在于本身的样本较少,但是因为健康餐的特殊性,商家在进行商品录入时,一般会对其进行描述,例如指出这个美食商品是“健康”的、“低卡”的、“健身”类型的,因此我们构建了一个分类模型,对健康餐进行识别。可使用的数据,包括商品名、商家导航栏、商家名称、商家对商品的描述等。而商家类目与商品的类目处于迭代状态,因此并没有对这部分信息进行使用。

识别过程如下:

考虑到同一商家菜品在不同业务线的菜品名可能略有差异,我们设计了一套菜品名匹配的算法,通过拆解菜品名称的量词、拼音、前后缀、子字符串、顺序等特征,利用美食类目识别、标准菜品名抽取、同义关系匹配等进行菜品实体对齐。例如:碳烧鸽=炭烧鸽、重庆辣子鸡=重庆歌乐山辣子鸡、茄子肉泥盖饭=茄子肉泥盖浇饭、番茄炒蛋=西红柿炒蛋等。目前,形成如下图的菜品归一体系:

这里对外卖美食知识图谱的应用,进行举例说明。主要涉及套餐搭配、美食商品展示等。

为满足用户的搭配成单需求,进行套餐搭配技术的探索。套餐搭配技术的关键在于,对美食商品的认知,而外卖美食知识图谱,则提供了最全面的数据基础。我们基于同商家内的商品信息和历史成单信息,对商品的搭配关系进行拟合,参考指针网络[2]等结构,构建了基于Multi-HeadAttention[3]的Enc-Dec模型,具体的模型结构如下:

具体的模型结构如下图所示:

基于外卖美食知识图谱构建的套餐搭配模型,在多个入口(“满减神器”、“对话点餐”、“菜品详情页”等)取得转化的提升。

通过分析外卖用户的需求,发现用户存在跨店相似商品对比的需求,为打破商家界限的选购流程特点,提供便捷的跨店对比决策方式。交互式推荐,通过新的交互模式,打造推荐产品的突破点。在用户的交互过程中,根据用户的历史偏好、实时的点击行为,向用户推荐可能喜欢的美食商品。如下图8(左)所示,在向用户进行同类美食的推荐时,美食知识图谱中的标准菜品标签提供了主要的数据支撑。

搜索作为外卖核心流量入口,承载了用户明确的外卖需求。用户通过输入关键词,进行菜品检索。在实际使用中,从搜索的关键词类型看,可能是某个具体的菜品,也可能是某种食材、某种菜系。在美食知识图谱中,图谱标签的高准确率和高覆盖,有助于提升搜索入口的用户体验,最新的实验也表明了这一点(新增部分食材、菜系、功效等标签,在搜索的线上实验效果正向)。

在挖掘方法方面,目前的挖掘数据主要为文本信息。在商品图片、描述、结构化标签等信息的融合方面,挖掘不够深入,模型的效果也有待提升。因此在多模态识别模型方面,我们也会进行相应的探索。

THE END
1.这是一份通俗易懂的知识图谱技术与应用指南机器之心一个完整的知识图谱的构建包含以下几个步骤:1. 定义具体的业务问题 2. 数据的收集 & 预处理 3.知识图谱的设计 4. 把数据存入知识图谱5. 上层应用的开发,以及系统的评估。下面我们就按照这个流程来讲一下每个步骤所需要做的事情以及需要思考的问题。 https://www.jiqizhixin.com/articles/2018-06-20-4
2.知识图谱有哪些应用知识图谱可以帮助分析社会网络、文化现象,以及历史发展进程。 知识图谱的应用是多样化的,它通过将现实世界中的复杂关系进行结构化表示,使得计算机可以更好地理解和处理人类语言和知识,从而在各行各业发挥着越来越重要的作用。随着技术的不断进步,知识图谱的应用范围还将继续扩大。http://www.360doc.com/content/24/0402/18/75092861_1119240104.shtml
3.知识图谱的应用篇(一)搜索与推荐之前从产品经理角度写了三篇有关知识图谱的基础知识,这篇文章和以后的文章会更贴近业务层面来写一些知识图谱的商业应用。为什么要把搜索与推荐放一起,是因为这俩兄弟绑定的太深了。 如何理解搜索与推荐 搜索,从需求角度来分析,可以还原成下面的这一段话, https://www.jianshu.com/p/801f0d90b155
4.知识图谱应用解决方案知识图谱提供了一种从海量文本和图像中抽取结构化知识的手段,让知识获取更便捷、知识整理更简单、知识应用更智能……知识图谱,正成为AI大数据时代组织升级知识管理、构建智能组织的关键技术。 蓝凌基于知识图谱的智能知识管理解决方案https://www.landray.com.cn/static-old/solution/tupu/index.html
5.什么是人工智能的知识图谱?知识图谱的组成构建应用有哪些人工智能(Artificial Intelligence,AI)是一种通过计算机模拟人类智能的技术,其应用范围越来越广泛。知识图谱(Knowledge Graph,KG)则是人工智能技术中的重要组成部分,它是一种结构化的、语义化的知识表示方式,能够帮助计算机理解和处理人类语言。 知识图谱的定义 https://cloud.tencent.com/developer/article/2286418
6.知识图谱技术在智慧城市中的应用澎湃号·政务澎湃新闻知识图谱技术在智慧城市中的应用 可快速关注我们 本文内容摘自《中国测绘》2019年第10期 在我国城市化进程快速发展的大背景下,城市作为一个复杂多元的超级系统,在为城市居民带来巨大便利的同时,在生态环境、基础设施、公共服务、城市文化、城市品质等方面的问题也开始逐步显现,各大城市相继出现“城市病”。为解决以上https://www.thepaper.cn/newsDetail_forward_6517100
7.知识图谱方向有什么前瞻性的应用或者研究领域?然而,知识图谱难以避免地存在不完整的问题,这在很大程度上限制了相关应用的性能表现。作为一种有效缓解https://www.zhihu.com/question/324396305/answer/2672340930
8.盘点知识图谱在五大智能领域的应用知识图谱工程实践仅仅是迈向智能的第一步。丰富的结构化知识很有用,但是如何将这些符号化的知识融合应用到计算框架中仍然是一大挑战。下面我们将介绍知识图谱如何提升智能水平。 一、语义匹配 语义匹配是搜索推荐、智能问答和辅助决策的基础。在没有知识图谱以前,文本匹配主要依靠字面匹配为主,通过数据库搜索来获取匹配结https://www.51cto.com/article/708098.html
9.梳理十大常见的知识图谱应用嘲–NRDStudio文献知识管理:将学术文献的元数据和引用关系整理成知识图谱,可以帮助学者进行文献检索、知识发现和学术交流。 图像和视频分析:将图像和视频内容与知识图谱关联,可以实现更精准的图像和视频理解,例如图像标注、物体识别等应用。 社交网络分析:通过将社交网络数据与知识图谱结合,可以进行社交网络分析、社群发现和影响力分析等https://nrdstudio.cn/a/4375.html
10.AI技术分支——浅谈知识图谱5. 知识图谱应用 知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。 目前,知识图谱已在智能搜索、深度问答、社交网络以及一些垂直行业中有所应用,成为支撑这些应用发展的动力源泉。 https://mse.xauat.edu.cn/info/1038/2192.htm
11.读书笔记知识图谱基础概念与关键环节解析数据应用知识图谱相当于一张网,是一种大型知识库,一种揭示实体之间关系的语义网络,是事物及其关系的形式化描述,分为通用知识图谱和领域(行业)知识图谱,如DBpedia,OpenKG,Wikidata. 知识图谱为多源、异构、海量、动态数据的表达、组织、管理和利用等提供了一种更为有效的方式,知识图谱促进了理解和处理,使得智能化水平更高,更https://download.csdn.net/blog/column/12008557/133420933
12.遥感知识图谱创建及其典型嘲应用技术相对于当前指数级增长的强大遥感数据获取能力,遥感大数据的智能处理和知识服务能力相对滞后,海量多源化遥感数据堆积与有限信息孤岛并存的矛盾日益突出,亟需有效的遥感领域知识建模技术来辅助挖掘遥感大数据的有用信息并形成知识服务能力。知识图谱技术以符号形式描述物理世界中的概念及其相互关系,具有强大的知识建模与推理应用能https://www.ygxb.ac.cn/thesis/91/19406941/zh/
13.知识图谱在审计的应用范文知识图谱在审计的应用范文 导语:如何才能写好一篇知识图谱在审计的应用,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。https://www.gwyoo.com/haowen/187536.html
14.建信金科陈铭新:以数据建模与应用为银行赋能新闻频道知识图谱应用 数字化经营的本质是连接,包括人与人的连接、人与物的连接和物与物的连接。基于丰富的数据资产,建信金科开展了数据线索连接探索工作,累计探索了资金上下游、泛集团派系、控股股东、一致行动人、企业实际控制人、小微企业黑名单关联、基于企业干系人资金交易流水的疑似团伙发现、疑似行外账户识别、失联人关https://news.hexun.com/2022-06-23/206214434.html
15.《知识图谱技术及应用》课程教学大纲.docx《知识图谱技术及应用》课程教学大纲.docx 8页内容提供方:大学教学资料库 大小:21.06 KB 字数:约6.36千字 发布时间:2022-11-29发布于上海 浏览人气:274 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)《知识图谱技术及应用》课程教学大纲.docx 关闭预览 想预览更多内容https://m.book118.com/html/2022/1127/6044021235005021.shtm
16.《知识图谱:方法实践与应用》(王昊奋)简介书评当当网图书频道在线销售正版《知识图谱:方法、实践与应用》,作者:王昊奋,出版社:电子工业出版社。最新《知识图谱:方法、实践与应用》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《知识图谱:方法、实践与应用》,就上当当网。http://product.dangdang.com/27920286.html
17.知识图谱在教育领域的应用知识图谱在教育领域的应用非常广泛,它通过将教育内容的结构化表示为图的形式,帮助实现教育资源的高效管理和智能推荐。具体的应用场景有以下几个方面: 1. 学科知识图谱构建。以学科知识为核心,建立知识点之间的层级关系和关联,形成学科知识图谱。这有助于学生构建知识体系,发现知识点之间的联系,消灭知识盲区。 2. https://localsite.baidu.com/article-detail.html?articleId=101170346&ucid=n1D4rHDvrjm&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10007&contentFrom=3