美团配送数据治理实践

大数据时代的到来,让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台。

但这里要特别强调一下,如果在大数据“拼图”中遗忘了数据治理,可能再多的技术投入也是一种徒劳。因为没有数据治理这一环节,其带来后果往往是:随处可见的数据不统一,难以提升的数据质量,难以完成的模型梳理,难以保障的数据安全等等,源源不断的基础性数据问题会进一步产生,进而导致数据建设难以真正发挥其商业价值。

因此,消除数据的不一致性,建立规范的数据标准,提高数据治理能力,实现数据安全共享,并能够将数据作为企业的宝贵资产应用于业务、管理、战略决策中,发挥数据资产价值变得尤为迫切和重要,数据治理呼之欲出。本文将介绍美团配送技术团队在数据治理方面的一些探索和实践,希望能够对大家有所启发和帮助。

数据治理,从严格的定义来讲是对组织的大数据管理并利用其进行评估、指导和监督的体系框架。企业通过制定战略方针、建立组织架构、明确职责分工等,实现数据的风险可控、安全合规、绩效提升和价值创造,并提供创新的大数据服务。从个人实践的层面来讲,数据治理是对存量数据治理和增量数据管控的一个过程,对存量数据实现由乱到治、建章立制,对增量数据实现严格把控、行不逾矩的约束。

数据治理本身并不是目的,它只是实现组织战略目标的一个手段而已。从组织职能和体量大小方面来看,不同类型组织的数据治理目标大不相同,而基于目前美团配送数据团队所处的组织职能和发展阶段来说,我们希望通过数据治理解决数据生产、管理和使用过程中遇到的问题,完善已有的生产管理流程规范,保障数据安全和数据一致性,从而促进数据在组织内无障碍地进行共享。

在数仓雏形阶段,也就是美团配送业务刚成立时,在该阶段中业务有两个特点:第一,重规模、快扩张;第二,业务变化快,数据需求多。为了快速响应业务的需求,并能够保障数据交付结果的准确性,我们主要进行技术规范和指标口径的治理,在规范治理方面,通过制定一系列研发规范来保障研发质量,并在实际建模过程中不断迭代和完善我们的研发质量。在指标治理方面,我们对存量指标口径进行梳理,从而确保指标口径对外输出一致。

在数仓迭代阶段,我们希望通过架构治理改变前期开发的“烟囱式”模型,消除冗余,提升数据一致性。并且随着数仓中管理的数据越多,数据安全和成本问题也变得越发重要。所以在该阶段,我们在产研层面逐步开展架构治理、资源治理和安全治理。在架构治理方面,我们明确了数仓中各层和各主题的职责和边界,构建一致的基础数据核心模型,并制定一系列的指标定义规范来确保指标的清晰定义,并基于业务迭代来不断完善和迭代相应的模型和规范。在资源治理方面,我们通过对不同层级的数据采用不同生命周期管理策略,确保用最少的存储成本来满足最大的业务需求。在安全治理方面,我们通过制定一系列的数据安全规范来确保数据的使用安全。

在能力沉淀阶段,我们基于前两个阶段所做的业务和技术沉淀,将前期一系列规范形成标准,从业务到产研,自上而下地推动数据治理,并通过建立相应的组织、流程和制度来保障标准在该阶段的全面落地实施,并通过建设数据治理平台来辅助更高质量地执行标准。

从大的阶段来看,数据治理主要分为存量数据“由乱到治”的阶段,以及增量数据严格按照规章制度实施确保“行不逾矩”的运营阶段。在“由乱到治”的过程中,我们需要沉淀出规章制度、标准规范,以及辅以规章制度标准规范实施的工具和组织。在增量数据的运营阶段,我们主要靠对应的组织确保规章制度的落实,通过审计定期考察实施效果,并在长期的运营中不断完善规章制度。在实现存量数据“由乱到治”的阶段,我们主要采取了“两步走”策略,具体执行策略如下所示。

第一步,主要围绕着业务标准、技术标准、数据安全标准和资源管理标准进行展开。通过业务标准,指导一线团队完成指标的规范定义,最终达成业务对指标认知一致性这一目标;然后通过技术标准来指导研发同学规范建模,从技术层面解决模型扩展性差、冗余多等问题并保障数据一致性;通过安全标准来指导我们加强数据的安全管控,确保数据拿不走、走不脱,针对敏感数据,用户看不懂;通过资源管理标准的制定,帮助我们在事前做好资源预算,在事中做好资源管理,在事后做好账单管理。

4.1.1业务标准

业务标准主要是指标的管理和运营标准,我们主要解决三个问题:指标由谁来定义,指标该如何定义,指标该如何运营。基于这三个问题,我们同时提出了三条原则:

4.1.2技术标准

这里所说的技术标准,主要是针对数据RD提出的建模标准和数据生产规范,通过建模标准来明确数仓分层架构,并清晰定义每一层的边界与职责,采用维度建模的设计理念。我们的整个仓库架构分为四层:操作层、基础事实层、中间层和应用层,并在每一层同步制定对应的建模规范,如下图所示:

除了建模标准外,我们还制定了涵盖从生产到运维环节的生产规范以保障模型的质量,主要包括上线前的模型评审、生产过程中的完成元数据配置、DQC、SLA和生命周期设置以及上线后的日常运维机制等等。尤其针对元数据管理和生命周期管理,我们分别制定了仓库每一层元数据维护规范和生命周期管理规范,其中元数据管理规范,是依据数仓各层级中各种类型表的建模标准来制定,需要做到规范命名,明确数据归属,并打通业务元数据和技术元数据之间的关系。而生命周期管理规范,是依据配送业务特点和数仓各层级现状来制定的,如下表所示:

4.1.3安全标准

4.1.4资源管理标准

在资源管理方面,配送技术工程部已经对资源管理涉及的内容进行了合理抽象和准确定义,抽象出租户、资源和项目组等概念。不管是后续的资源预算还是资源管理,我们都需要基于租户和项目组来进行运营,因此,对于业务团队而言,我们只需要将租户和项目组特定职能划分清楚,然后根据不同的职能归属我们的资产,并分配生产该资产所需要的资源。为了方便后续的运营,我们对每个租户和项目组分配确定了责任人,由责任人对运营结果负责。

对业务部门来说,资源管理的关键是对数据资产做清晰的分类,基于数据的分类划分不同的租户和项目组,将数据和租户、项目组实现一一映射。由于租户和项目组都有特定的责任人对其负责,因此,我们通过这种映射关系,不仅实现了资产的隔离,还实现了资产确权(项目组负责人同时对资产负责和运营)。我们整体将数据分为两大类,一是原始数据,包括流到数据中心的数据和日志中心的数据,针对流入数据中心的数据,根据其产生的方式不同,又进一步分为业务数据和流量数据。二是加工数据,对应着数据团队的仓库建设和其他团队的集市建设。基于上述的描述,针对资源管理,我们做了如下划分和确权:

第二步,落实第一步的标准,完成数据治理第一阶段的目标,实现存量数据“由乱到治”,并完成相应组织和工具的建设,为实现第二阶段“行不逾矩”这一目标提供工具和组织能力。在此过程中,主要分成三个方面的治理工作:第一,架构模型“由乱到治”的治理,消除模型冗余、跨层引用和链路过长等问题,在架构上保证模型的稳定性和数据一致性;第二,元数据“由乱到治”的治理,实现指标的标准定义、技术元数据的完整采集并建立指标与表、字段的映射关系,彻底解决指标认知一致性,以及用户在使用数据过程中的“找数难”等问题;第三,围绕着隐私安全和共享安全加强数据的安全管控来实现数据走不脱、拿不走,以及隐私数据看不懂这一目标。

4.2.1架构治理

总结起来,架构方面的治理主要是解决两个问题:第一,模型的灵活性,避免需求变更和业务迭代对核心模型带来的冲击,让RD深陷无休止的需求迭代中;第二,数据一致性,消除因模型冗余、跨层引用等问题带来的数据一致性问题。

模型灵活性

配送指标体系建设的一个重点就是要输出各组织层级的规模、体验和效率指标,实现对运力的有效管控,运力所属组织的层级关系会随业务的迭代而不断变化。为了适应这种变化,避免仅仅因增加维度带来中间层数据的重复建设,我们将组织层级维表由固定层级建模方式调整为桥接表的方式来自适配组织层级变化,从而实现了中间层模型可以自动适配组织层级的变化,能自动产生新维度的指标。如下图所示:

数据一致性

数据一致性得不到保障的一个根本原因,是在建模的过程中没有实现业务口径标签化,并将业务口径下沉到主题层。很多同学在基于需求进行开发时,为实现方便,将新指标口径通过“CaseWhen”的方式在应用层和中间层进行封装开发,主题层建设不能随着业务的迭代不断完善,RD在开发过程中会直接引用仓库的快照表在中间层或应用层完成需求开发。久而久之,就会造成数据复用性低下,相同指标的口径封装在不同的应用表来满足不同报表的需求,但随着应用的增多,很难保障相同指标在不用应用表封装逻辑的一致性,数据一致性难以得到保障,同时这种方式还带来两个严重后果:第一,跨层引用增多,数据复用性低下,造成计算和存储成本的浪费;第二,一旦指标口径发生变化,将是一个“灾难”,不仅影响评估是一个问题,而且涉及该指标的应用层逻辑调整对RD来说也是一个巨大的挑战。

因此,我们在“由乱到治”的治理过程中,以衍生事实的方式实现业务口径标签化,将业务逻辑下沉到主题层,消除跨层引用和模型冗余等问题,从技术层面保障数据一致性是该阶段架构治理的重点。我们在业务上,已经划分了严格的数据域和业务过程,在主题建设层面,将业务划分的数据域作为我们的主题,并基于业务过程进行维度建模,将属于该业务过程的指标口径封装在对应业务过程下的衍生事实中。

4.2.2元数据治理

元数据治理主要解决三个问题:首先,通过建立相应的组织、流程和工具,推动业务标准的落地实施,实现指标的规范定义,消除指标认知的歧义;其次,基于业务现状和未来的演进方式,对业务模型进行抽象,制定清晰的主题、业务过程和分析方向,构建完备的技术元数据,对物理模型进行准确完善的描述,并打通技术元数据与业务元数据的关系,对物理模型进行完备的刻画;第三,通过元数据建设,为使用数据提效,解决“找数、理解数、评估”难题以及“取数、数据可视化”等难题。

首先,为保障业务标准的顺利实施,实现业务对指标认知一致性这一目标。我们协同产研、商分、业务部门推动成立了度量衡委员会,并建立起指标运营机制,通过组织保障来实现指标运营按照规范的标准和流程实施。如下图所示:

其次,基于配送业务的现状和未来演进方式,我们进行了高度的业务抽象,完成了主题、业务过程和分析方向等元数据内容的建设。配送即物流,通过线上系统和线下运营,我们将用户的配送需求和美团的运力进行有效的资源配置,实现高服务体验、低成本的配送服务。对外,我们将配送服务通过平台化的方式,提供给用户、商户和电商平台,以满足不同用户在不同业务场景下的配送需求。对内,我们通过不同的调度模式将运单池中的运单调度给合适的骑手来完成履约,平衡规模、成本和体验之间的关系。如下图所示:

基于以上的业务模式,我们划分了运单主题(对履约数据域下的数据进行构建,支撑规模和体验的数据分析需求)、调度主题(调度数据域下产生的数据,用于支撑调度策略的分析)、结算、评价、投诉、取消主题(用于支撑体验、成本数据分析需求)和管控主题(用于支撑运力奖惩、违规和招募分析需求)等各种主题,并在每个主题下划分对应的业务过程,在应用层制定分析方向的分析标签,通过对元数据内容的建设完成对业务的抽象,为物理模型的刻画准备了基础数据。

第三,元数据服务建设,我们打通了元数据从采集到构建再到应用的整条链路,为使用数据提效,解决“找数、理解数、评估”难题以及“取数、数据可视化”难题。在整个建设过程中,我们围绕着元数据采集、元模型构建、元数据服务以及最后的产品应用进行展开,整体架构如下图所示:

元数据采集

元数据采集分为人工录入和自动抽取,通过人工录入的方式实现物理表的准确归属(包括该表属于仓库哪一层、对应的主题、业务过程、星型模型关系等)以及指标的采集,从而完成技术元数据和业务元数据的采集,通过自动抽取的方式完成生产元数据的采集和使用元数据的采集,主要包括:物理模型的依赖关系、存储占用、热度、等信息。

元模型构建

分为以物理表为核心的基础元模型构建,以及以血缘为中心的血缘元模型。基础元模型构建以物理表为中心,打通其与技术元数据(主题、业务过程、Schema)的关系,实现了物理表的清晰归属,打通其与生产元数据的关系,为其加上了物理表查询热度、资源消耗、查询密级等生产使用信息,打通其与指标、维度和应用的对应关系,为上层的取数应用建立了完备的元数据。血缘元模型以血缘为中心,不仅构建了从上游业务表到仓库离线表的物理血缘,而且打通了仓库离线表到下游对应报表的血缘,为后续的影响评估构建了完备的元数据基础。

元数据服务

统一元数据服务(OneService),主要提供两类元数据服务,提供查询表、指标、维度基本信息的基础元数据服务以及查询表级血缘、字段级血缘的血缘服务。

元数据应用

主要孵化出了三个产品,以“找数、理解数、影响评估”为应用场景的数据地图(Wherehows),以“取数、数据可视化”为应用场景的数据可视化(QuickSight),以及以管理审计为目的的管理审计报表。

4.2.3安全治理

安全治理主要加强了敏感数据的安全治理和数据共享环节的安全治理。通过对隐私数据的安全治理,不仅要保证其在存储环节的不可见性,而且还要保证在其使用环节对用户进行双重鉴权,字段的密级鉴权和解密的密钥鉴权;通过对数据共享环节的安全治理,我们在数据分级分类的基础上,使数据的权限控制从表级权限控制扩展到行级权限控制。

敏感数据安全治理

敏感数据的安全治理,主要是解决敏感数据的存储安全和使用安全。离线场景下,敏感数据存储安全要解决两大挑战:

因此,为解决仓库处理方案与上游业务系统和下游BI系统的解耦问题,我们在上游敏感数据落到ODS环节,确保落到ODS层的敏感数据必须是明文,为保障其安全,对ODS层的所有数据进行文件加密,但是在使用层面,对下游链路透明保障下游链路的正常生产,并限制ODS层数据权限的开放。ODS层数据只用于安全生产,通过此方案既屏蔽了上游处理方案对仓库的影响,又解决了敏感数据的安全问题。当数据从离开仓库时,在传输环节对敏感数据进行可逆操作,将敏感数据以明文的形式推入BI库,实现与下游BI系统的解耦。为解决敏感数据在整个生产链路的扩散,我们在快照层对敏感数据进行脱敏处理,从快照层开始消除敏感数据,为保障敏感数据的可逆性,将ODS层的敏感数据抽取到安全库中并进行加密存储,实现安全独立管理。具体执行如下图所示:

针对敏感数据的使用安全,我们通过对敏感字段的权限控制和对解密密钥的权限控制,来实现敏感数据使用安全这一目标。针对单独抽取的敏感数据,我们除了针对敏感数据设置其相应的密级确保敏感数据的权限管控外,还基于”暗语”的加密方式为每个项目组分配一个相同的密钥,并且将该密钥存放到与Hadoop集群集成的KMS进行管理(确保支撑离线计算的高并发),确保解密时实现密钥的权限管控。

共享环节安全治理

针对共享环节的安全治理,我们主要是在数据生产环节完成数据的分级分类和数据确权,在数据的使用环节完成数据的表级权限控制和行级权限控制。确保数据在使用环节规范的审批流转,权限开放以后的安全审计,保证数据走不脱。

首先,我们在生产环节B3、B2、B1层数据按照主题或实体C层数据按照应用方向进行逻辑划分,并设定资源的密级和权限负责人。特别地为实现B3层数据在查询环节可按照业务线进行权限管控这一目标(即行级鉴权),针对B3层数据,我们标记该数据需要在查询环节进行行级权限管控,标记使用行级鉴权所需的字段和该字段对应的枚举值。

其次,在使用环节,我们按照资产密级和使用人角色完成数据的审批流转,实现数据的安全共享。

第三,针对B3层数据,审计是否设置了行级权限管控。在数据开放时是否存在越权使用的情况,以及针对即将离职员工加强数据的使用审计,保证数据走不脱。

在数据“由乱到治”的治理过程中,我们不仅实现了存量数据的“由乱到治”,并且在此过程中沉淀出了一系列的建模方法论、工具,并建立了相应的安全小组和指标运营组织。同时,我们为后续增量数据治理确保数据建设“行不逾矩”,提供了强有力的组织保障、稳定的辅助工具和严格的执行标准。在数据治理的第二阶段实现增量数据的“行不逾矩”的过程中,我们主要围绕大数据架构审计、大数据安全与隐私管理审计、大数据质量管理审计和大数据生命周期管理审计这四方面的工作展开,保障治理工作的持续进行,不断提高了组织的治理水平。

数据地图作为元数据应用的一个产品,聚焦于数据使用者的“找数”场景,实现检索数据和理解数据的“找数”诉求。我们通过对离线数据集和在线数据集的元数据刻画,满足了用户找数和理解数的诉求,通过血缘图谱,完成物理表到产品的血缘建设,消除用户人肉评估的痛苦。

离线数据场景

1.关键字检索和向导查询共同解决了“找数据”的问题:大部分的检索数据场景下,数据使用者都可以通过关键字检索来得到匹配结果。剩下的一小部分场景,例如,对于新人入职后如何了解整个数仓和指标的体系(数仓分几层,每层解决什么问题,都孵化出什么模型;整个指标、维度体系都是怎么分类,有哪些指标和维度),这部分场景可以使用向导查询功能。向导查询相当于分类查询,将表和指标按照业务过程进行分类,用户可以按照分类逐步找到想要的表或指标。

2.我们打通了业务元数据和技术元数据之间的关系,提高了“找数据”的能力:通过“Wherehows”查找到指标后,不仅不可查看指标的业务定义,还能查看指标的技术实现逻辑,指标在哪些维度或维度组合中已经实现,并且能够在哪张表里找到这些维度,或维度组合的指标数据。反之,也可以知道在某个维度下已经实现了哪些指标,对应的指标在哪些表里。这些功能能让用户更加方便地找到想要的数据。

3.我们提供了较为完善的数据信息,帮助用户更好理解数据:对于表的信息,“Wherehows”除了提供表和字段的中英文名称、描述信息等基础信息外,为了帮助用户更好地理解表的建设思路,我们还提供了表的星型模型(可以关联的一致性维度及对应的维度表)、表的血缘关系等信息。

业务数据场景

业务数据场景主要想解决的一个问题是,如何知道一个业务表(MySQL表)有没有同步到数仓。如果没有同步,能够找谁进行同步。因为已经打通“业务表->数仓表->产品”三者之间的血缘关系,我们能够轻松解决业务数据场景的问题。

生产评估场景

在日常数据生产工作中,我们经常需要对表进行影响评估、故障排查、链路分析等工作,这些工作如果靠纯人工去做,费时费力。但现在我们已经打通了“业务表/字段->数仓表/字段->产品”三者之间的血缘关系,就能够在10分钟内完成评估工作。对于不同的场景,血缘链路提供了两个便捷的功能:过滤和剪枝。例如,某个表逻辑需要修改,需要看影响哪些下游表或产品?应该要通知哪些RD和PM?这种情况下,血缘工具直观地显示影响了哪些负责人和产品,以及这个表的下游链路。

有些表的链路很长,整个血缘关系图很大,这样会导致用户定位信息或问题。所以血缘工具提供了剪枝的功能,对于没用的、不想看到的分支可以剪掉,从而让整个链路变得更加直观。

其次,我们为用户提供一系列的组件,帮助用户基于为其开放的数据集实现指标的二次加工和数据可视化功能,满足其在不同业务场景下的取数和可视化应用。如下图所示:

经过三个阶段的治理工作,我们在各个方面都取得了较好的效果:

未来,我们还会继续通过组织、规范、流程等手段持续对数据安全、资源利用、数据质量等各方面进行治理,并在数据易用性上下功夫,持续降低用户的数据使用成本。

THE END
1.chatgpt在线和本地部署区别OpenAI的ChatGPT是一个强大的聊天机器人模型,以其出色的语言理解和生成能力而备受赞誉。对于一些用户来说,在线使用ChatGPT可能存在隐私和网络连接的问题。为了解决这些问题,我们可以将ChatGPT本地部署,使其在离线环境中使用。下面将介绍如何进行本地部署,以及一些相关的考虑事项。http://chatgpt.cmpy.cn/article/1757675.html
2.数字时代的真实与虚拟,在线状态背后的真相探索社交媒体是我们在线生活的重要组成部分,过度使用社交媒体可能导致我们忽视现实生活,影响我们的工作和学习,我们需要学会合理控制使用时间,保持工作与生活的平衡。 2、网络虚假信息的识别 网络上的信息纷繁复杂,真假难辨,我们应该提高自己的信息素养,学会识别虚假信息,以免被误导,我们还要学会理性思考,不盲目相信网络上的信息http://5g.hnjwwzy.cn/post/700.html
3.实时在线状态:基于心跳机制的状态检测三、 如何实现基于心跳机制的在线状态检测? 设计心跳协议 在实际的应用中,需要设计一个心跳协议,规定心跳信号的格式、发送频率等参数,以及超时时间的设定。一般来说,心跳信号的格式可以包括设备或应用程序的ID、时间戳等信息,以便接收方进行验证和处理。 实现心跳发送和接收 https://www.jianshu.com/p/29e0e613ac94
4.数字时代的无限可能探索,在线的奥秘与潜力影碟机用解码摘要:在线时代,数字技术的飞速发展带来了无限的可能性。人们通过在线平台交流、学习、工作和娱乐,实现了信息的即时传递和资源的共享。在线状态不仅意味着个人的连接与互动,更代表着一种不断探索、创新和发展的态度。我们正处于一http://xtgsdz.cn/post/559.html
5.奇迹MU私服离线挂机怎么设置?奇迹MU私服是一款备受欢迎的角色扮演游戏,它为玩家提供了丰富的游戏内容和独特的游戏体验。离线挂机功能是奇迹MU私服的一大特色,它允许玩家在不在线的情况下,让游戏角色自动进行任务、战斗和升级。然而,如何设置离线挂机以达到最佳效果,对于许多玩家来说可能还是个谜。本文将为各位玩家详细解析奇迹MU私服离线挂机的设置方https://www.haonh.com/d/3533
6.电子仪表测量论文12篇(全文)1.理解电子计数器测频原理,测频误差主要与哪些因素有关? 答:电子计数器按照式f=N/T的定义进行频率测量的。在开门时间,被测信号通过闸门进入计数器计数并显示。若闸门开启时间为Tc和输入信号频率为fx,则计数值为:N=Tc/Tx=Tc*fx。闸门的宽度是由标准的时基经过分频得到的,通过开关选择分频比,是已知量。因此,https://www.99xueshu.com/w/ikeyyxuf1qd9.html
7.理解iOS消息推送一文就够:史上最全iOSPush技术详解3)离线/远程Push:这就是iOS程序员最熟习的APNs这一套东西了,它使得APP处于后端或者者被kill的情况下仍能收到网络通知,最常见的应场景就是IM聊天工具了。 本文将对iOS Push的在线push、本地push及离线(远程)push进行了详细梳理,详情相关逻辑、测试时要注意的要点以及相关工具的用。小小的Push背后蕴藏着大大的逻辑https://www.songma.com/news/txtlist_i2865v.html
8.如何理解在电脑上执行服务器离线操作的含义?新闻中心如何理解在电脑上执行服务器离线操作的含义? 服务器离线通常指服务器不再与网络连接,无法提供正常的服务。这可能是由于维护、故障或其他原因导致的。在电脑上让服务器离线意味着通过某种方式(如断开网络连接或关闭服务器电源)使服务器停止对外提供服务。 在现代计算和互联网的环境中,服务器扮演着至关重要的角色,从https://www.henghost.com/news/article/158960/
9.2020届计算机科学方向毕业设计(论文)阶段性汇报介绍多图的离线协同式匹配和在线增量式匹配,MGM-FLoyd,MGM-SPFA和FastSPFA。 叶昊然 带有预算限制的拍卖机制 本次汇报介绍了单人拍卖中有条件的和无条件的预算限制,证明了无条件的预算限制下最优拍卖机制的形式,给出了无条件和有条件下最优拍卖机制期望收益的差距,并设计了预算限制下的近似最优拍卖机制和鲁棒拍卖机https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3709
10.基于语音识别语音合成自然语言理解等技术在本地端实现了基于Knowledge-Aware Neural TTS (KAN-TTS) 语音合成技术,基于深度神经网络和机器学习,将文本转换成真实饱满、抑扬顿挫、富有表现力的语音,使得离线语音合成效果趋近于在线合成效果。同样的语音合成声音定制的合成效果与真人录音相比,几乎可以以假乱真。 https://developer.aliyun.com/article/1173110
11.离线作业(参考答案)奥鹏作业答案优学网22春北师《学前儿童社会教育》离线作业(参考答案) 公告: 在线作业试卷查看 -> 学前儿童社会教育 在线作业试卷列表 单选 1.幼儿社会教育的活动目标包括三个维度:情感、态度;能力;还有( ) 分值:2.5 A. 认识 B. 知识 C. 认知 D. 感知 2.( )设计的“三座山测验”用来评价儿童能否采用别人的观点 分值:2.5 http://www.youxue100f.com/a/bjsf/2022-04-12-8128.html
12.ubuntu22.04lts服务端安装桌面离线包本文将详细讲解如何在Ubuntu 22.04 LTS服务端通过离线包安装桌面环境。 我们需要理解离线包的概念。离线包是指预先下载好的软件包,可以在没有网络连接的情况下安装。这对于网络不稳定或带宽有限的环境特别有用。在本例中,我们有两个tar.gz格式的文件:t1.tar.gz和t2.tar.gz,这些可能包含了桌面环境所需的各种软件https://download.csdn.net/download/eastflowing/86298099
13.DiDiFood中的智能补贴实战漫谈架构滴滴技术从流程图中可以看到,在构建训练样本和离线评估测试样本时,我们剔除了那些被线上模型干预后的样本。 这是因为在理论上,我们是在三个假设的前提下去使用模型拟合一个在观察数据中并不存在的【增量】的。 其中,针对其中第二条假设,我们的个人理解是我们虽然允许有影响分配机制的特征存在,但是我们需要将这些特征也纳入我https://www.infoq.cn/article/mpkjAbSW9mwmy5AdArhM
14.货运公共平台离线状态持续30天背后的罚款机制与考量因素,货车在线在现代物流体系中,货运公共平台通过互联网技术和信息化手段将货主、物流公司、运输车辆等各方资源进行有效整合,提高了物流效率,由于各种不可预见的情况,如系统故障、网络问题或维护更新等原因,这些平台有时会出现短暂的离线状态,对于这种情况,我们需要从多个角度进行理解和分析。 https://www.cxwlhy.com/con1350.html
15.推荐系统完整的架构设计和算法(协同过滤隐语义)如下图所示, 一个典型的基于离线训练的推荐系统架构由数据上报、离线训练、在线存储、实时计算和 A/B 测试这几个模块组成。其中,数据上报和离线训练组成了监督学习中的学习系统,而实时计算和 A/B 测试组成了预测系统。另外,除了模型之外,还有一个在线存储模块,用于存储模型和模型需要的特征信息供实时计算模块调用。https://cloud.tencent.com/developer/article/1508050
16.《王者荣耀》王者营地营地在线指的是什么营地在线含义详解王者荣耀王者营地的状态分别有游戏在线、离线、营地在线和游戏中,其他状态都比较容易理解,那么营地在线是什么意思?营地在线退出了还可以在线吗?九游网小编接下来就给大家解释一下营地在线状态,大家了解一下就好。 王者荣耀王者营地营地在线是什么意思? 1.玩家登陆了王者营地,并且就在营地上聊天或者看资讯,总之手机界面是https://www.9game.cn/news/3911667.html
17.离线与在线LowE玻璃的区别?昨天,小鹰为大家介绍了什么是离线和在线Low-E玻璃,而这两个玻璃既有在线和离线之分,便一定是有区别的,那么他们区别又是什么呢? 根据两种Low-E玻璃膜层和工艺的不同,我们可以这样理解他们的区别: ①离线Low-E玻璃 离线Low-E是银膜,而我们日常常听说的单银、双银、三银Low-E玻璃,一般都是离线Low-E玻璃。 https://m.zhuxiaobang.com/weitoutiao/1749702716089347?channel_source=baidu_biji
18.广告行业中那些趣事系列32:美团搜索NER技术实践学习笔记在美团搜索场景下,通过对商家POI结构化信息、商户评论数据、搜索日志等独有数据进行离线挖掘,可以很好地解决领域实体识别问题。经过离线实体库不断的丰富完善累积后,在线使用轻量级的词库匹配实体识别方式简单、高效、可控,可以很好地覆盖头部和腰部流量。目前,基于实体词典库的在线NER识别率可以达到92%。实体词典匹配主要https://maimai.cn/article/detail?fid=1686752130&efid=Q0i5V3ue6-GqDN_BO0eMTw
19.致远电子周立功ZLGLAB7504逻辑分析仪2.8 关于状态优先和位置优先的理解 位置优先: 位置优先模式保证了触发点一定会落在用户的触发位置上。如图所示。 从图中可以看出,用户设置的触发位置为 xx%,当启动逻辑分析仪采集时,数据会马上被采集并存入存储器中,在数据末存满到的触发位置前,即使有出现符合触发条件的触发信号,它也不会触发的,只有当数据存满至http://www.jetyoo.com/jetyoo-Products-34763643/
20.Steam平台GTA5离线启动教程,轻松体验游戏乐趣理解离线启动的重要性 离线启动游戏,顾名思义,即在没有网络连接的情况下启动并运行游戏,对于某些玩家来说,离线启动可以避免网络延迟、掉线等问题,同时也能保护个人隐私和安全,在公共网络环境下,使用离线模式可以避免个人信息泄露的风险,对于一些需要频繁更换账号或不想被在线记录打扰的玩家来说,离线模式也是不错的选择http://m.huigefood.cn/glzx/10706.html
21.中药化学成分分析的新方法丨Engineering在线2D LC分析中引入了一个特殊接口(包括切换阀和样品环),将各流分自动转移至第二维色谱柱。中药全在线2D LC-MS分析的1D分离时间较长(1~2 h,为了提高分辨率),而2D分离时间较短(约30 s,受旁路采样环路的体积限制)。因此,该方法的峰容量通常小于离线2D LC-MS联用法的峰容量;但是,其重复性优于离线2D LC-https://www.360doc.cn/article/1086308277_1086308277.html
22.新华社胸片100%曝光:如何解读和理解胸片检查的精准性12月11日,难哄过审,《大瑶山剿匪记》高清无删减全集手机在线播放,B站视频离线观看技巧之必备指南,狗狗的东西又硬又烫:探索其奥秘,Zoom与动物Zoom:它们的奇妙世界,2024逆水寒配置要求一览:战斗节奏连击组合策略,《哥布林的老巢第03集》动漫在线播放,樱桃视频黄版下载-樱桃视频黄版v5.1.2,《回复者术之重启世界http://m.ouzhehua.com/v/video/20241206/77612659.shtml