京东平台内容合规的技术与挑战

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序把安全装进口袋

商品只卖1分钱,以为捡了便宜,购买时发现邮费要收20元!

直男给女朋友买生日礼物的口红,买成了山寨品

商品主图各种满减宣传,实际购买和主图价格宣传不一样

买了商品,先收到了礼品包,很久才收到想要的货

京东搜索结果页/推荐结果页整体杂乱,图片没有其他平台好看

……

这些关于商品价格、服务、泛假货/质量的问题都是我们持续努力在解决的问题。

合规团队的主要工作从技术角度是做平台内容理解与审核,从业务角度总结下来主要做以下三方面的事情:

商家、商品经营的审核,从产品、价格、服务维度识别恶意商品信息与商家行为。

商品信息的审核,包括商品的图片、标题、类目等信息的准确性与一致性校验。

短视频、直播的审核,从安全、合规、质量维度检测内容风险。

内容审核是一个对抗性很高的风控场景,一方面,我们要不断提升识别能力,检测商家的恶意对抗行为,结合运营机制惩治违规商家,保障用户体验,另一方面,我们需要尽量不打扰正常商家的经营,提供前置检测与修改建议的能力,不影响商家运营效率。因此,既要建立一套发现、识别、处置的违规治理机制,又要从商家、用户视角建立观测指标体系,尽量量化对用户体验、商家经营的影响,还要从平台视角出发降低审核成本,所以具体工作中要平衡用户体验、商家效率、平台成本,是一个复杂而又有趣的工作。针对每一个具体场景都需要深刻理解业务并设定好业务核心指标,与业务、运营、产品充分沟通并搭建业务运营流程,最后紧追行业趋势与竟对动向结合业务做出技术深度。

在明确我们要负责的业务场景后,需要设定可量化的核心指标,在设定指标时,需要避免依赖单一指标,因为这可能导致结果的片面性进而引发决策偏差,在合规域我们需要考虑内容消费者(C端用户)、内容生产者(商家/达人)、内容平台(京东),并考虑对立统一的综合指标:

用户客诉/抱怨率

商家申诉率

平台审核成本/监管罚金

明确核心业务指标后,需要从业务实现的角度设计运营流程,实现风险感知、识别、处置的闭环,下图是我们正在逐步建立和完善的流程:

明确业务流程后需要基于点状的业务需求进行横向的标签体系设计以及服务接口设计并建立指标监控体系防范技术风险:

大家都知道产品、价格、服务是决定用户体验的三要素,基于经营理念我们首先从合规视角盘点了影响这三要素的核心问题,包含假货治理和内容审核、价格治理、服务治理。然后,基于用户、商家、平台视角制定业务指标体系、建立产品能力以及运营流程。最近部门承接了价格治理的能力建设,面临很多挑战,也取得了一定成果,下面以价格治理的一个子项-价格虚高的具体案例具体说明下合规域遇到的挑战。

价格虚高要解决京东域内商家发布商品价格标价虚高的问题,依赖于商家的健康经营行为的规范,因此需要规模化的发现价格虚高问题并对商家进行触达,并对多次违规的商家进行惩治。

识别上,通过站内比价、站外比价可以获取商品的价格水位进而判断是否价格虚高,具体依赖可以拆解为站外数据获取以及可比价商品判别,通过对站内外可比价商品数据进行比对识别价格虚高商品,但在实际工作中均有很大挑战,在产品、运营、研发角度均有一些解法,以下侧重算法角度的方案设计。

我们基于流量表现数据我们将商品分为价格可信商品、价格不可信商品,对于价格不可信商品,有站内可比价商品的基于价格比对进行判断,否则基于价格预测模型进行兜底,下面是关键能力的一些粗略介绍:

2.3.1构建可比价模型

构建“商品可比价”算法训练任务,同品/相似品识别结果作为输入特征,通过已有的人工标注结果分析,训练算法模型,增加判别因素,提升识别进准度。

2.3.2价格预测大模型

基于站内商品的历史成交数据,明确商品的合理价格区间,构建价格锚点数据集,下图是某同品组价格与成交的分布图。然后,基于已有商品价格构建“价格预测大模型”,输出商品预测价格以及预测置信度。

2.3.3商家触达与治理

模型化方案的优势是可以快速覆盖类目,并有效覆盖价格虚高的违规case,商家治理需要更高的精度,可以作为识别漏斗,结合业务规则进行圈选和治理。商家经营建议不需要太高精度,我们增加了商家触达预警的方式引导商家合理设置价格。

随着技术的发展,过往很多公司的技术壁垒,以及个人工作中沉淀的调参、特征工程心得,都成为了历史,对个人来讲,我们需要适应和学习不断变化的东西拥有自己趁手的“武器库”,同时追求和沉淀过程中不变的思维框架,不断加强业务洞察能力以及数据驱动解决问题的行为方式。

对于个人来讲,我们需要保持对用户需求和市场变化的敏感度,理解业务需求背后的用户痛点并思考自己是否可以多想一些、多做一点,通过不断的业务理解与持续的技术应用创新,实现业务价值与个人的成长。

作为合规域的一员,很庆幸处在一个与业务很近的前沿领域,技术上既需要结合大模型、多模态等使用NLP、CV技术从信息层面做内容理解,也需要洞悉业务挖掘商家行为序列模式与关联做异常检测,就像毛主席说的:“与人斗,其乐无穷”,我们在和恶意商家的博弈中不断积累自身的业务理解与技术深度,实现审核成本的降低、效率的提升,以及用户客诉的降低。

THE END
1.统一门户所带来的企业安全危机技术平台统一待中心综上所述,企业统一门户的建设和权限管控对于信息系统的安全和高效运作至关重要。通过合理平衡安全性、用户体验和法律合规性,企业能够有效应对权限管理中的挑战和风险。借助先进的技术整合和严格的管理措施,不仅可以提升系统的稳定性和操作效率,还能够支持企业的业务发展和创新,为员工和管理者提供更优质的工作体验。https://blog.csdn.net/CC_longhua/article/details/139989991
2.统一门户是什么,统一门户的优缺点360织语统一门户已经成为了企业、政府和个人用户获取信息的重要渠道,将各种信息资源集中在一起,形成一个统一的平台供用户访问。 统一门户可以整合各种类型的信息资源,包括新闻、天气、股票、交通等,为用户提供全方位的信息服务,用户可以在一个平台上获取所需的所有信息,无需在各个网站之间跳转,大大提高了信息的获取效率。 https://www.ccwork.com.cn/hangyezixun/453.html
3.统一门户产品介绍腾讯云开发者社区统一门户是一个新兴的信息化平台,它通过整合和组合多个不同应用系统和平台,为用户提供一个入口和交互的门户,有助于促进组织和企业内部的信息和数据管理和交互,提高工作效率和管理水平,是数字化转型和升级的一种重要方案。但是,搭建和应用统一门户也面临着一些挑战,需要有实际的需求和成熟的技术支持。https://cloud.tencent.com/developer/news/1415042
4.什么是融合门户数字一体化服务平台高校融合门户平台是指将校内外各类信息系统、教学资源、服务应用等,通过统一的身份认证体系和数据交换标准进行深度融合,形成的一个集教务管理、学术研究、校园生活服务于一体的一站式数字平台。融合门户这一概念的核心在于“融合”二字,意味着打破信息孤岛,促进资源共享,提升服务质量,从而达到提高教育管理效能、增强师生互https://zytec.cn/kdetail/207.html
5.叙州区人民政府“十三五”期间(2016—2020年),宜宾县“智慧城市”将立足宜宾实际,突出信息资源整合开发利用的主线,以城市公共基础数据库为基础,以满足政务管理、城市管理、产业经济、民生服务应用需求为导向,以数据交换与共享平台、大数据平台、智慧城市运行综合管理平台、智能门户公共服务平台为核心,建设“智慧宜宾、幸福宜宾”,到2020年https://www.ybx.gov.cn/xxgk/zwgk/wgk/jggk/201610/t20161013_569892.html
6.忽视统一企业门户建设,企业将面临这些致命风险!2. 企业不重视统一门户建设的致命风险 风险一:信息碎片化,决策失灵 没有统一门户的企业,信息往往散布在不同的部门和系统之间,导致信息碎片化。员工在不同平台之间来回切换,找不到最有价值的数据和工具。这不仅浪费了大量时间,还影响了决策的时效性与准确性。当关键数据和信息无法集中获取时,决策者就无法及时掌握https://baijiahao.baidu.com/s?id=1817202531687752865&wfr=spider&for=pc
7.圣农集团:用飞书打造全新办公门户,数字化闭环管理驱动可持续发展系统集成打造全新办公门户,统一审批待办“一揽子”落地? ? 当业务板块分散在多个渠道中,每个板块都需要独立的管理和资源投入,协调和沟通的不便利性愈发凸显,企业将面临更复杂的管理挑战。圣农集团 IT 系统建设过程中,也曾存在工具分散、信息割裂等问题。为此,圣农集团将 OA 平台、人力、财务等多个系统的审批流程https://www.feishu.cn/customers/sunnergp
8.基于GPU智能精准调度平台的算力整合:数字经济的新引擎算力整合实践的关键是GPU智能精准调度平台、逻辑资源池、多资源池接入以及算力交易门户等。 GPU智能精准调度平台 在算力整合的过程中,GPU智能精准调度平台发挥着至关重要的作用。它能够接入多个GPU池化集群,实现对资源的统一管理和调度。这种平台的建立,是实现算力整合的关键一步。 https://www.virtaitech.com/company/techPages/detail?id=4vx0m9d7p2e2xwmxm09ba7fvnj
9.资讯详情02 直面挑战,数据治理与平台建设协同开展 数据治理是一个复杂的系统工程,涉及到多个领域,存在着不少的困难和挑战。中国移动数据涵盖近9.67亿移动客户和2.49亿有线宽带客户,随着数据规模的持续增长,规模效应的量变带来技术和管理的质变,对数据治理提出更大挑战。 https://it.10086.cn/news/index_detail_42588.html
10.电子商务调研报告天门市目前拥有电子商务孵化基地1个,自建电子商务交易平台2个,建立行业垂直门户平台分支机构3个,信息服务门户若干个。 1)电子商务孵化基地 20xx年,由天门畅享生活?婴幼儿用品有限公司投资建设的天门市首个电商孵化基地--天门电子商务创业孵化基地投入运营,旨在为创业者提供电子商务平台,已有天门美食大搜罗、罗马小站、宏博https://www.ruiwen.com/gongwen/baogao/1261303.html
11.信创门户改造的挑战与机遇****统一工作台**作为**统一门户系统**的一部分,提供了一个集中的工作平台,使得团队协作更加高效。它集成了各种办公应用,提供了一个便捷的工作环境,使得员工可以更加专注于核心业务。 **信创门户改造**的机遇在于,它不仅能够提升企业的自主创新能力,还能够促进企业全面数字化转型。通过改造,企业可以构建安全、可靠的数http://www.ganxikeji.com/doc_28901279.html
12.爱数荣获Gartner2018内容协作平台魔力象限挑战者称号!AnyBackup 多云时代统一数据管理平台 AnyShare AGI 时代的智能内容管理平台 AnyRobot AGI 时代的可观测性平台 AnyDATA AGI 时代的人工智能集成平台 AnyFabric 智能内容管理平台 AnyShare订阅一体机 AnyShare for 华为云 电子文档安全管理系统 一体化优势 企业内容门户 内容数据湖 NAS 数据整合 AnyShare 可观测性 https://www.aishu.cn/cn/news-detail/1910/3
13.从无到有从小到大,今日头条大数据平台实践经历的那些坑面临哪些挑战? 当前,头条每日处理数据量为7.8 PB、训练样本量200 亿条、服务器总量40000 台、Hadoop 节点3000 台。 数据生命周期分为生成、传输、入库和统计/分析/挖掘,每个环节的难度都会随着数据规模的变大而上升。平台建设面临的挑战是由庞大的数据量和业务复杂度给数据生成、采集、传输、存储和计算等带来的一系https://www.51cto.com/article/542849.html
14.修复规划为深入贯彻习近平生态文明思想,依法履行统一行使所有国土空间生态保护修复职责,统筹和科学推进山水林田湖草沙一体化保护修复,高标准打造美丽中国“江西样板”,维护国家重要生态安全屏障,满足人民日益增长的优美生态环境需要,助推经济高质量发展,遵循《江西省国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要》设定https://www.zyny.org.cn/newsinfo/2592691.html
15.大模型知识库大模型训练开箱即用的企业大模型应用平台由于LLM主要通过训练数据学习,如果训练数据不包含足够的行业特定知识或上下文信息,模型可能难以准确理解复杂的业务数据。因此,LLM可能在理解复杂数据集、特定行业术语或上下文中的细微差别方面存在挑战。这可能导致数据分析结果的误解或错误解释。 幻觉问题(Hallucination) https://53ai.com/news/qiyejingying/128.html
16.oa与erp如何集成零代码企业数字化知识站统一用户界面:通过门户集成技术,将OA系统和ERP系统的功能集成到一个统一的门户中,方便用户访问和使用。 五、集成的挑战与解决方案 1、数据一致性问题 在OA和ERP系统集成过程中,数据一致性是一个重要的挑战。为了解决这个问题,可以采取以下措施: 数据校验:在数据同步过程中,进行数据校验,确保数据的准确性和一致性。 https://www.jiandaoyun.com/blog/article/1519954/