FacebookYouTube都会遇到的内容审核难题,今日头条是怎么解决的?

在内容数量井喷的同时,内容的形式也在不断变化。除了传统的图文类内容,音频、长视频和短视频,以及直播的比例在不断增加,这对于那些那些既追求实时性(发布速度和用户体验)、又追求不出问题(举报率和负面事件)的内容平台审核管理,提出了巨大而严峻的挑战。

包括Facebook和Youtube在内的国际顶级UGC平台,如今在这类老生常谈的问题上依然十分吃力,尤其是发达国家最为在意的低龄内容、种族歧视和跨国文化/多语言等问题,它俩其实一直未能交出一份让各方满意的答卷。而国内今年比较知名的互联网内容社区类产品里,下架甚至关停的已经不下于0余款,尽管它们各自都有各自的问题,比如色情内容、微商、内容涉政等等,但归根结底,这还是用户激增带来的日益增长的内容生产量和无法跟上的审核措施和效率之间的矛盾。

一、Facebook:用AI和算力应对海量内容

Facebook在整个2018年遭遇过巨大的信任危机,除了数据接口和用户隐私的处理不当,平台上的内容审核政策也受到严重质疑。但其实,它背后的核心问题是,这家公司本就是世界互联网内容吞吐量最大的平台。

而这些内容并不只在Facebookapp发布和消费,还在这家公司旗下月活15亿的Whatsapp、13亿的FacebookMessenger和10亿的Instagram上面传播和推广,所以这家公司承受的内容审核压力才会如此之大。

那么Facebook拿出的应对措施是什么?在去年那场著名的美国国会听证会上,扎克伯格在一小时内提及AI三十余次,坚称AI是平台内容审核的答案,他的原话是:“未来的五到十年,AI将成为世界上最大的社交网络的捍卫者,在全球范围内解决其最紧迫的问题,同时也帮助公司回答有关审核、公平和人类无节制等棘手问题。”

小扎自称,Facebook上99%有关ISIS和基地组织的内容,都在人们看到之前被人工智能系统标记,并且被删掉。但AI想要和内容审核结合并落地,必须拿出一些具体的手段来。Facebook现在的审核分为文字审核、图片和视频审核,以及大量的人工配合。

Facebook为这些实时而海量的信息编目录、并让其被搜索是件很困难的事情,所以他们才转向了人工智能。

而Facebook的图片和视频审核系统名为Rosetta,利用光学字符识别系统来处理图片和视频内容,每天可以实时地从超过10亿张图像和视频帧中提取信息并识别多种语言背后的含义。

另外,Facebook在上周刚刚开源了它们在图像识别及视觉领域的最新模型:ResNext101。这是一个在Instagram的图片标签上预训练,并在ImageNet上微调的模型。ImageNet是由知名人工智能专家李飞飞教授团队于2009年发布,包含了超过两万类物体共计一千四百多万张图片,后来的很多计算机视觉任务模型都以此为基础进行训练。

而ResNext101更上一层楼,利用了Instagram上的35亿张图片(比ImageNet的1400万多了200多倍)进行了预训练,并以人们为图片添加的话题标签(#hashtag)为类别,研发出来的有着超强特征提取能力的图像识别模型。

在这两大系统的背后,其实是Facebook的人工智能研究院FAIR(FacebookArtificialIntelligenceResearch)在发挥功劳。比如其物体识别技术(Objectrecognition),以含有数十亿参数和数百万案例训练的神经网络为基础,给了挑战最大的图片和视频审核有力的支持。另外它们也使用自我监督学习(SSL)探索大量数据,让机器可以通过分析未标记的图像、视频或音频来学习世界的抽象表达,这也是FAIR将AI能力规模化的努力之一。

早年间YouTube以草根内容起家,后来出现了大量的搬运号,主要以盗版电视台的精品内容为主。虽然平台的数据因此飙涨,但也因此陷入了旷日持久的官司里。

2007年至2009年,包括维亚康姆(美国第三大传媒公司),Mediaset(意大利的传媒集团)和英超联赛(英国最大足球联赛)等在内的组织对YouTube提起诉讼,声称它在用户上传侵权内容方面毫无作为。

后来,ContentID的内容监测能力在不断改进后,比如使用哈希算法标记有风险视频,阻它们被次上传,也获得了显著的成效。以2017年Q4为例,平台删除了800万条“令人反感”的视频,有670万条都由监测软件自动标记。大约75%被标记的视频,在被用户观看之前就被下架。

人性化的是,YouTube于2014年9在前端增加了受限模式(RestrictedMode),用以过滤情暴内容,但是户可以自己选择开启还是关闭。依据户举报以及其它识别规则,受限模式可以直接为用户过滤部分不当内容。

当然,YouTube的这些内容审核能力有赖于谷歌的深度学习技术GoogleBrain作为支持。GoogleBrian拥有一个收集用户信息(如观看历史和用户反馈)的神经网络,以及一个用于对所显示部分视频进行排列的神经网络,通过引入机器学习工具,自动标记暴力、色情和低俗等极端视频,并将违规内容报告给人工审核员进行验证。

和Facebook类似的是,就算有了Google多方面的技术支持(包括资金、人才、算法、云和服务器等),YouTube的AI标记、内容审核与识别技术也并不完美。2018的时候YouTubeCEO苏珊·沃西基承诺,未来会雇佣至少一万名人工审核员,以补足算法的局限。

不过,Google对YouTube的帮助也不会仅仅限于内容审核,GoogleBrain的技术已经被应用在安卓系统的语音识别、Google+的图片搜索、以及YouTube的智能推荐。所以,现在的YouTube早已从一个视频UGC社区,到慢慢成为拥有海量内容、搜索驱动的视频综合网站,到拥有了视频推送能力的应用。如今,占据用户在YouTube上观看视频总时长70%的内容,是由推荐算法引擎驱动的。

三、头条:审核系统对外开放会带来哪些变化?

如今的今日头条已经拥有海量的用户和多种形式的UGC内容,尽管体量上还颇有不如,但在内容审核方面遭遇的挑战同脸书和Youtube已经十分类似。

在文本识别领域,头条同时应用了“Bert”和半监督技术,训练数据集包含920万个样本,准确率提升至91%。在图片识别领域,“灵犬”采用深度学习作为解决方案,在数据、模型、计算力等方面均做了针对性优化。最近新版的灵犬3.0发布,重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别和文本识别,后续,灵犬还将支持难度最大的语音识别和视频识别。

不过,今日头条的人工智能实验室王长虎也提到,AI暂时还是有缺陷的,今日头条现在有将近万余人的审核团队在辅助AI的审核。比如对于低俗内容,它的定义本来就相对笼统难以精确,这项工作即使对人来说也不容易,交给机器做更难实现。

比如世界名画中常常出现裸体女子,如果完全交由机器判断,机器通过识别画中人物的皮肤裸露面积,就会认为这幅画是色情低俗的;而某些拍摄芭蕾舞的图片,以机器的视角来看,其实类似于裙底偷拍。

Facebook曾经因为“裸露”,误删了一张著名的越战新闻照片,内容是一位小女孩遭到汽油弹炸伤、浑身赤裸奔跑,事件发生后引起了美国新闻界的巨大争议。但是,在当前内容创作和消费规模海量增长的趋势下,如果依然纯靠人工去解决所有问题,那么必然效率低的同时还无法满足用户需求。

比如邓丽君的歌曲,早年被认为是低俗情色歌曲,如今早已被普遍接受并传唱大街小巷;比如内衣和内衣模特出现在购物平台上,会被默认为正常,但如果频繁出现在新闻资讯平台上,就可能被认为有低俗嫌疑;而正常的热舞内容,提供给成年人看,符合常规标准,但如果开启了青少年模式,这些内容就不应该出现。这就是由于时代背景、使用场景、用户人群不同而导致审核标准可能大幅变动的案例。

海量数据的产生、不断变化的标准,这都要求大公司在这方面的投入必须越来越多,而这本质上就成了一场资本丰厚的对手之间的军备竞赛。

未来中小团队将难以竞争,这就是一个巨头独霸的竞技场。不过好在,随着人类进入社会的数字化程度越来越高,新一代的移动互联网原住民们在享受技术带来的便利的同时,也对技术可能的负面在耐受度和适应性上不断提高。

毕竟自工业革命之后起,就有无数人曾对技术会带给社会的冲击抱有极端负面和悲观的预期,认为技术可能会加速崩坏我们数万年来自然形成的人类社会结构,但是哪一次,人类社会不又是顺利转型成功、发展出与技术相匹配的职业和生活模式、并且越走越好了呢?

THE END
1.今日头条视频审核规则今日头条视频审核规则查看全部10条评论回答 写回答 yszxyyxxk 1.一般情况,视频发布后会在2小时内会完成审核;如遇特殊情况会有延迟,最迟不会超过24小时。2.所有发布的视频均会由审核编辑进行初审和复审,如果内容被判定为标题党、低俗、广告、低质等不合规范的问题时,平台将对违规内容进退回修改、退回不收录。https://wap.zol.com.cn/ask/details_16275506_1505396_3.html
2.头条专栏学堂专栏审核要求 1.审核流程? 专栏创建提交后都需要通过审核环节,这是因为它们可能被分发给成千上万的今日头条用户,只有拥有较完善的审核机制,平台才能保证用户接受到的信息合法合规,才能给用户提供优质的阅读体验。? 现有的审核包括机器审核和人工审核双重把控。机器会对内容进行过滤,人工会重点筛查,根据内容具体情况https://mp.toutiao.com/docs/column/201/2571
3.头条视频总是审核不通过怎么办,头条发视频审核一直不过1、视频审核不通过,常常因为你是“直接视频搬运工”,那么如何做好视频搬运工作呢,首先你可以把编辑的电影名称在头条上搜一下,看看是否有进行判断,基本就能确定是否重复了,当然了,做视频的话,要想收益高还是首推做原创,这样收益比较高,减少侵犯版权的风险。但是呢,若不是全职做自媒体的,若是每天花时间和精力做也是https://www.shangyexinzhi.com/article/5129626.html
4.重庆今日头条视频审核工资待遇(招聘要求,就业前景)重庆今日头条视频审核工资根据企业近一年发布的薪酬数据统计所得,可能因统计算法等因素出现偏差,仅供参考。 由职友集 jobui.com 统计开发并发布,保留所有权利,任何网站或个人使用必须给出来源并注明链接。 关注“职友集”官方QQ空间 点击关注 > 你可以: https://www.jobui.com/salary/chongqing-jinritoutiaoshipinshenhe/
5.有去今日头条面试视频审核的么?面试时要回答什么问题?有去今日头条面试视频审核的么?交流一下经验。面试时要回答什么问题? #字节跳动##求面经# 更多模拟面试 查看更多 > 模拟面试第 1 名 字节跳动 模拟面试 有人482天前测试并获得了面试报告 模拟面试第 22 名 牛客 模拟面试 暂无牛友练习,快去练习吧 (0) (0) 分享 举报 浏览5802 https://acm.nowcoder.com/discuss/439961?channel=-2&source_id=discuss_terminal_discuss_sim
6.怎么提取今日头条上的视频提取视频文章的步骤 1. 编写好脚本 要在头条上提取视频文章,首先要编写一个脚本。这个脚本的作用就是从指定的视频平台爬取视频内容,并将其转换成适合发布在头条的格式。根据不同的视频平台,脚本的编写方式可能会有所不同,但基本原理是相通的。 2. 审核脚本 https://tool.a5.cn/article/show/108761.html
7.「济南今日头条抖音视频审核招聘」1、负责审核今日头条内容是否违法; 2、负责审核今日头条短视频用户举报; 3、负责今日头条短视频内容抽检、复审。 岗位要求: 1、热爱视频方面工作,关注新闻时事,具备一定的新闻敏感度; 2、工作细致耐心,责任心强,具有团队合作精神 3、本科及以下学历,已取得本科毕业证 https://m.zhaopin.com/jobs/CC529736931J00118502212.htm
8.自媒体短视频创作规范平台审核标准自媒体短视频创作规范、平台审核标准 - 今日头条、西瓜视频、百度好看视频、腾讯视频.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 短视频制作包装规范、成片审核标准更新 一、视频格式 1、视频大小 最大支持 500M 以内文件 2、视频时长 不支持时长小于 10 秒或大于 5 分钟 10 秒的文件https://max.book118.com/html/2021/1123/8100126046004043.shtm
9.今日头条整改:下架万条问题视频,封禁4864个问题账户10%公司4月6日,今日头条方面发布通报称,旗下火山小视频、西瓜视频等短视频平台共计下架问题视频10318条,重置封禁问题账户4864个,增加视频审核相关词库敏感词1700余条,目前已经落实多项整改举措,并在视频社区大力推荐社会正能量内容。 此前的4月1日,央视曝光火山小视频、快手等存在未成年孕妇、未成年妈妈和未成年二胎妈妈主播https://www.thepaper.cn/newsDetail_forward_2062202
10.FacebookYouTube都会遇到的内容审核难题,今日头条是怎么解决的?新版的灵犬3.0发布,重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别和文本识别,后续,灵犬还将支持难度最大的语音识别和视频识别。 不过,今日头条的人工智能实验室王长虎也提到,AI暂时还是有缺陷的,今日头条现在有将近万余人的审核团队在辅助AI的审核。 https://blog.csdn.net/Diting2020/article/details/127203017
11.吴小平民企退出论背后:今日头条张一鸣价值观偏差反观今日头条,其发布和推送的文章完全没有上述严格的审核机制,而是依靠所谓算法以及不专业的审核员,可是他们能否了解和认识到文章是否涉及政治经济呢? 令人深思的是,一个平台在一周内连续出现上述情况,正说明在被政府查处之后,今日头条所谓的审核机制在流量的KPI之下形同虚设,张一鸣的机器算法价值观越来越危险。http://mp.cnfol.com/29171/article/1536926763-138003348
12.今日头条西瓜视频怎么开直播,开通直播权限的方法喜欢看今日头条的小伙伴们相信在观看新闻和视频的同时也会经常观看一些直播内容,在这个全民直播的年代,相信作为今日头条的粉丝您也会有蠢蠢欲动想在头条开通自己直播的想法吧。那么我们该怎么才能开播直播呢,其实吧,在今日头条看到的直播的内容其实是旗下西瓜视频的直播内容所以呢我们要想在今日头条开通直播的话,需要在http://www.xfdown.com/zixun/64681.html
13.视频“网信北京”微信公号:北京市网信办等部门约谈今日头条等视频| “网信北京”微信公号:北京市网信办等部门约谈今日头条等网站 查处涉黄内容 将要求苹果商店对直播应用加强审核看看新闻Knews综合2017-04-19 07:49展开更多相关推荐 更多精彩内容 叙利亚总理被反对派带走! 00′08″ 一眼看天下 12/08 小店对无收入者免单 消费者的举动令店老板感动 00′15″ 时讯 12/07 https://m.kankanews.com/detail/kDwmzv0pq2l
14.急招2000名内容审核员,推崇算法的今日头条为何反其道而为之那么今日头条此举如何解释呢?除了旗下的多个短视频APP也需要人工内容审核需求外,我们还可以从它的这则招聘中找到其他的线索。 内容审核、天津这两个关键词,让人很容易联想到早年的新浪微博。在几年前一篇名为《新浪微博审核员压力下的机械化生存》的新闻中,向外界描述了略有几分神秘的新浪微博内容审核员的工作和生https://www.tmtpost.com/3004435.html
15.院头条与抖音背后的AILab怎么样51CTO博客抖音是一个开放共享的平台,内容审核方面的挑战是非常大的。字节跳动一直用人工智能辅助审核,过滤理解这些视频内容,进行版权识别。 05总结 字节跳动人工智能实验室虽然涉及到多方面人工智能领域,但是在应用方面主要是在自然语言处理与计算机视觉方面,大概是因为主要要围绕今日头条,抖音和西瓜视频进行产品算法的研究。https://blog.51cto.com/u_14122493/6954462
16.今日头条审核岗面试经验面试题(共12条)今日头条审核岗面试经验(济南历下) - 今日头条审核岗 2019-11-22 14:19:53 | 网上申请 面试过程: 地址: 济南高新区万达广场一个会议室至少有30个人都是来面试的,2点20左右一个人首先讲了一下他们公司如何如何,花费大概20分钟, 然后说来面过的,本科以下学历的,不接受夜班的,都可以走了,然后开始群面, 每https://m.job592.com/pay/comms31947823.html
17.今日头条投放广告5、文章审核与修改:提交文章后,今日头条会进行审核。一般情况下,审核时间为几个小时到一天不等。如果文章未通过审核,你可以根据反馈进行修改,然后重新提交。二、怎么投放广告?首先,你需要登录今日头条的广告投放平台,注册一个广告主账号。然后,根据你的需求选择合适的广告形式(文字、图片、视频等) https://m.verywind.com/dd/%E4%BB%8A%E6%97%A5%E5%A4%B4%E6%9D%A1%E6%8A%95%E6%94%BE%E5%B9%BF%E5%91%8A.htm
18.内容审核形势严峻,FacebookYouTube和今日头条都是怎么解决的?*近新版的灵犬3.0发布,重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别和文本识别,后续,灵犬还将支持难度更大的语音识别和视频识别。 不过,今日头条的人工智能实验室王长虎也提到,AI暂时还是有缺陷的,今日头条现在有将近万余人的审核团队在辅助AI的审核。 https://www.eatui.cn/xinxiliu/29799.html
19.今日头条原创审核标准,准新手须知今日头条原创审核标准,准新手须知 很多新手对原创的理解不够全面所引发的困惑吧,而这种困惑却无时无刻不在影响我们的内容创作。因此,今天,有必要再跟大家聊一聊什么是原创,平台对原创的标准是什么。 第一:我们主观上的原创,可能更偏向“内容独一无二”http://www.52thing.com/11917.html