本次主要是更新了之前内容字体、板式、名次等问题,对于播控内容也有了更加详细的推导依据。
名词介绍
一、运营后台介绍
运营后台,主要是提供给视频行业编辑、运营者使用的ToB操作系统。在整个后台中,运营者可以对运营的主体(音视频)、前端展示内容详情等视频平台显示的关键信息进行维护。
1.1运营后台主要工作
1.2视频信息的前后台数据交互模式
上古时期,前端展示的内容信息一般是从后台数据库中直接读取展示,通过这样的交互模式可以实现最快捷的运营信息维护与展示。伴随着业务复杂度不断提升导致如各业务之间对于同一字段信息展示模式完全不同,消费展示出现问题时需要全链路研发人员一起查询等问题的凸显,这个时候希望通过后台数据库与前端直接交互的模式便不再适用于逐渐复杂且增速迅猛的业务模式。经过一系列的探索,目前绝大多数成熟的视频平台所采用的模式是独立出来一个在线的数据平台,数据平台中会对数据的结构进行规范,仅开放某几个平台系统可以对数据平台的信息进行写入和修改,同时支持端服务端在数据平台中进行数据读取。这样做的好处有3点
综上所述,目前成熟的前后台交互如下图所示:
二、运营信息
2.1VideoID
通常情况下,一个视频内容对应着一个视频ID,我们可以将视频ID称之为VideoID,简称为VID。后续无论是对这个视频进行上下线处理,运营信息维护,合集添加,都是以这个VID为主体进行操作的。同时,在消费端,在视频信息展示中(包含于个性化)都是以当前VID作为唯一认证标识。
通过上述介绍,可以发现,一个视频的运营信息都会以一个固定的格式写在这个视频的VID下,服务端写入修改,客户端读取显示都是以唯一的VID为准。
2.2编目
编目信息主要是对视频壳进行维护,一般视频编目必要信息包括
2.3分类与标签
传统视频网站中对于视频的归类是通过三级分类实现的,由于三级分类存在覆盖范围广度不够、新内容类型分类更新速度慢、内容标签单一性等问题,所以在当下对于视频的描述中,通常会使用分类标签的方式对一个视频进行详细描述。
2.3.1分类
2.3.1.1什么是内容分类
2.3.1.2分类的应用
通常情况下,描述一个视频的定位,一般是根据视频的类型-题材-赛道(圈层)进行视频归类,我们通常称这种内容的分类方法是三级分类。通过这样的归类,可以尽可能的降低用户在搜索、筛选选取内容的成本,同时在推荐应用中,可以通过三级分类中的组合形式将视频聚合起来,把热度高的聚类形成topic的视频组合推荐给用户。
在对创作者的视频进行归类时,通常情况下是由创作者、内容理解系统、平台运营者对创作者视频进行内容归类。一般创作者视频的归类主要是视频题材和对当前题材的子赛道,如题材是美食,赛道可以是美食制作、美食侦探、美食测评、美食记录……
2.3.2标签
标签通常情况下是基于一个视频分类的基础上,通过标签的方式对视频特点进行补充。标签标记通常是对一个视频亮点功能进行标记,主要的标记为视频内容的属性或者主题。标签相对分类而言,具有更强大的灵活性,更广泛的特征描述属性,更快捷的建设速率,因此在对视频进行特征描述时,标签描述的更新要远快于归类更新。
2.3.3小结
在对视频内容进行描述时,主要是通过分类的方法决定了视频所在的赛道子集,通过标签进行特征描述。通过分类和标签组合的形式对一则视频进行描述。
2.4个性化信息维护
2.5推荐标注
推荐标注主要是运营在对视频进行内容评定时的一个重要参考指标,一般情况下会对视频的推荐标注主要是基于两个方面。其一是通过算法和人工的方式为视频标记好他的推荐等级;其二是对内容做相应的强制过滤处理,这里仅针对于一些特殊的视频。
2.5.1推荐等级
视频的推荐等级主要是通过内容理解后台和人工标注的方式进行推荐等级的判定。一般情况下,推荐等级为4个阶梯,即强烈推荐、一般推荐、可推荐、不推荐,代表的权重分别是2、1、0、-1。
2.5.2强制处理
针对于一些特殊情况的视频,有在线上播放的需求,但是这些视频不能够成为单独的视频让用户消费(比如想互动视频的一个子分支,用户仅看一段视频是看不明白的),这视频是需要进行强制屏蔽搜索、屏蔽推荐、屏蔽榜单的。
2.6主创阵容
主要记录的是视频的主创人员,一般需要标记的字段有导演、编剧、出品方、主演,出品国家(地区)等信息。
三、播放控制
现象:我们在一些视频平台中,可以发现如腾讯视频看《复仇者联盟》系列的电影,PC网页端最高能到720p,但是手机端可以看1080p的的视频。有时候在B上可以刷到繁体字的《非自然死亡》电视剧集推荐,点击去以后播放视频播放器无法正常播放并弹窗当前视频仅在中国台湾地区有效的提示。
本质:透过现象看本质是分析问题是研究系统中非常重要的能力之一,通过上述现象,我们可以发现一个视频每一种清晰度的码流在可能会在不同端进行上线,并不一定都会上线。除了端的上线之外,很多时候由于内容全球化策略以后,视频会控制上线的国家或地区。本着后台产品设计准确化、灵活化的特点,因此对于一个主体(视频、合集)的播放控制都需要按照其主体的最小颗粒度进行调配和设置。
一个视频(合集)的播放控制权限决定了用户是否可以看到这个视频,在什么地域能看到这个视频,什么端能够看到什么清晰度的。同时鉴于完整的用户体验,如果不希望用户能够看到视频壳但是无法播放视频内容,播控的概念还需要应用到搜索、推荐、榜单等多种关联场景;由于实体的博控状态是按照最小颗粒度进行说明的,为了方便客户端、推荐、搜索等业务实施为用户进行数据展示,需要对实体给出一个总的播控状态,来告知推荐搜索等业务当前内容是否可以获取。
3.1播控的应用场景
前文说明,播控决定了一个视频所有的播放要求,因此视频播控的覆盖范围主要有以下4方面:
3.2播控的数据结构
视频的播控是需要针对于一个码流进行设计,因此视频的的播控需要有两重设计,一个是针对视频ID的,一个是针对当前VID下码流的设计。在视频平台中,除了视频本身以外,对于一些视频聚合形成的实体,如专辑、播单等,同理需要具有播控逻辑的,这样在以播单、专辑等聚合推荐、搜索、筛选时,才能够规避只能看到聚合实体看不到里面内容的情况。因此,结合播控需要控制的维度,以一条视频为例,播控的数据结构如下所示:
视频ID:
总上线状态:上线/下线(通常情况下有一个端在一个地区内上线,即可判定为上线)
后面是各独立码流上线状态,一般是从最基础的低清晰度开始写。我们以720p码流举例:
码流
720p
上线
端
iphone
Android
Phone
iPAD
Pad
AppleTV
AndroidTV
地区
北美
上线上线上线上线
欧洲
上线上线上线上线上线上线
拉美
下线
下线下线下线下线下线
中国
大陆
下线下线下线下线下线下线
四、聚合型内容
视频平台中除了单一视频本身之外,还存在着一些聚合型内容,有些聚合型内容可以由创作者定义,有些聚合型内容需要有视频平台的运营者定义,我们可以称这些聚合型内容与基础的视频内容一样,都称之为一个实体。最常见的聚合型的实体主要有专辑、播单、资源位这三类。
4.1专辑
专辑的定义可以理解为将主题表达一致的内容组合而成的实体。通常情况下,如我们见到的一部电视剧的视频内容可以组成一个专辑,一个up主可以将自己相同主题的内容组成一个专辑。
对于专辑,同样需要创作者和平台运营者维护它们的运营信息,如专辑的封面图、专辑的名称、专辑的推荐语、专辑的推荐等级及专辑的播控状态。由于专辑中的视频和专辑的绑定关系相对较强,因此专辑中的正片内容通常的推荐等级会继承专辑的推荐等级,在UGC专辑的搜索、推荐中,通常情况下会过滤掉专辑这种聚合形式的实体推荐及搜索,主要是以单独的视频内容实体作为推荐的基本单元。在PPC专辑中,一般情况下有专辑的视频实体通常情况下会以专辑的方式进行推荐。
4.2播单
4.3资源位
资源位的定义为由人工或算法定义的一组动静态或态数据。在视频平台中资源位通常情况下是应用在重要位置需要平台进行强把控的数据源,因此资源位的包含了人工数据自动数据两种方式的组成。
4.3.1基础能力
如前文所述,资源位是由人工或算法定义的一组静态或动态的数据,因此资源位的基础能力主要是通过人工及自动的方式定义数据。因此数据池的部分可以拆解成人工数据定义及自动数据定义。
4.3.1.1人工数据定义
人工定义数据通常是运营人员通过经验对资源位的内容进行人工定义,人工定义主要是通过人工的方式内容池的实体数据
具体的业务逻辑是,通常一个被应用于焦点图的数据是通过获取资源位数据,需要人工在数据中定义好添加的实体有什么(放专辑、播单、节目等),每个实体是否需要人工定义排序,每个实体是否需要自定义展示图(如果需要则需要定义实体的展示图,实体的现实名称是否要跟实体标题相同(不相同需要重新定义)等多个方面,在人工内容池建立的时候,人工内容池中的内容可以大于端上展示的位数。
4.3.1.2自动数据定义
人工通过分类和标签圈定数据:对于某些频道的自动化内容,很多时候需要对这些内容做主观性质的内容定位,如动漫频道的国风动漫,这个时候就需要对国风动漫做相应的频道、分类、标签的定义。整体的频道、分类、标签的定义中,频道支持多频道内容获取,分类和标签需要定义成支持或和且两种关系都存在,
数据补充及特殊数据权重提升:在对资源位的内容池做好基本定义以后,可以通过一些补充的内容填充规则在内容池中加入更多的内容,如用户是通过Googledeeplink下载app的,Google又会告知我们用户观看到的是哪个内容包才下载的app,这个时候如果一个资源位数据第一个展示在用户面前,这个时候可以增加需求为“将deeplink内容添加进资源位的内容池中,根据资源位频道等限制信息做好相应的去除及原内容的去重,剩余内容在推荐中的权重加权0.1。”通过这样的方式可以对资源位的数据做更多的定义。
4.3.1.3混合数据
混合数据即人工定义数据自动定义数据的组合。
4.3.2推荐策略
4.3.2.1推荐流程
由于在推荐中存在人工干预的情况,因此在整体的推荐中需要增加人工干预及限制。前文提到有数据存在播控限制,因此在整体推荐中,仅获取播控为上线的数据。整体推荐流程如下:
4.3.2.2指标构建
在视频平台中决定用户留存最关键的可以分为两个数据,其一是视频消费数据;其二是视频互动数据。视频消费数据主要是CTR、EVR、付费率这三者,视频互动的的数据主要是LTR、WTR两个。
视频消费指标:
核心指标设定:在推荐中,圈定内容池以后,算法会计算出来预计的指标收益率,在推荐中产品经理需要找到对留存影响最大的关键指标,并以次为核心依据,设定视频的推荐指标。
4.3.2.3规则加持
具有推荐池和指标算法指标,在推荐中由于在部分场景下召回视频存在限制,用户属性存在一些特殊因素,因此需要一些特殊规则进行推荐加持从而获取更好的指标。如我们看完一部非常好的电影以后,竟会会在1个月以后二刷,那么这个二刷推荐机制便是其中的规则加持。规则加持适用于人为因素占据主导的推荐场景中。
五、RN专题
5.1建站元素
在视频平台中,RN专题页的主要能力是快速上线热点内容并为热点内容配置具有特殊样式的内容页,因此在键盘配置中所需要的元素如前端页面展示的需要添加内容实体、页面主题色、页面主图、文字说明等,这些都需要在RN专题页中有所体现。
5.2建站功能
根据元素,建站的主要功能可以分为基于数据和基于展示两部分功能点。
5.2.1基于数据:
5.2.2基于展示:
有了数据源以后需要存在一个基于展示而衍生出来的后台能力,主要是能力包括网页搭建、灵活的上下线控制。
5.2.2.1页面搭建
页面搭建主要基于三个部分
5.2.2.2上下线控制
建站需要上下线的控制,支持人工上下线和自动上下线,同时需要在自动设置好以后可以人工强行进行上下线操作。
5.2.3兼容性
由于是后台系统,所以兼容性在RN上起到了决定性作用,兼容性强的RN专题页可以应用在TV、Pad、Phone、PC等多个端,运营人员可以在一次操作中完成所有页面的构建,这样才能极大的提升操作效率。
六、其它:
除了以上五大点之外,在视频平台中存在很多特殊的概念,在此做一些列举:
1、排播系统
2、同剧关联:同剧关联通常情况下是以节目为角度的定义,如《阿甘正传》(国语版)相对于《阿甘正传》(原版)就是一个超剧集,通常的定义是作为同剧关联的内容在定义中属于一个内容但是不同实体,在搜索的时候需要都搜索出来,某些地方的推荐中需要规避其中某一个实体。伴随着多音轨多字幕视频的不断完善,超剧集这种方式正在走出历史舞台。
3、主发多发:主发多发可以理解为两个是完全一样的内容,发布在同一个平台中。如果是UGC内容会直接对相同且不是原作者的内容标记为抄袭做极大的降权处理。如果PPC内容,由于不同频道运营边界的问题,会在各个频道中只保留当前频道的主发或多发的视频,但是在整体的推荐中会更加倾向于推荐主发的原始视频。