在2023年的《完蛋!我被美女包围了!》爆火之前,你就有机会喊出同样的句式。
只要在2021年用谷歌搜索中文内容,肯定会发出这句感叹,“完蛋!我被百科知识网包围了!”
满屏都是“XX知识网”“XX百科网”的链接,域名全是脸滚键盘打出来的乱码,内容全是程序生成的废话。
互联网界的丧尸围城,也不过如此。
这种装满垃圾信息的网站,就是内容农场的一种。
一般的小农场,圈一波钱之后立刻跑路,像是前边说的“XX知识网”,现在都上不去了。
这就是互联网垃圾信息的最终形态吗?当然不是。
前几天央视曝光了一家国内的MCN机构,靠着AI技术采集热点信息,批量生产虚假新闻,图文并茂,每天能生产几千条。
这种模式像极了内容农场,但它的本质是营销号。
互联网垃圾信息的生产模式,就是从内容农场升级到营销号,再升级到AI胡言乱语的过程。
01
内容农场,上古互联网遗毒
国外早期的内容农场里不一定有机器人,但一定有活人。
像是DemandMedia这家公司,2009年左右玩得风生水起。
DemandMedia收购了很多网站,教人做事的eHow.com就是其中之一
人类的特点是复读机,互联网的特点也是。关键词重复多了,就能提高在搜索引擎里的排名。
靠着这堆互联网垃圾,DemandMedia在2011年公开募股,估值15亿美元。但是不到3个月,网站的流量暴跌40%,因为谷歌更新了算法。算法更着更着,就把DemandMedia更没了。
靠着玩弄算法暴富,迟早会被算法反噬。
后来的内容农场都学聪明了,它们不搞大阵仗,闷声噶韭菜。而且不生产内容,只是内容的搬运工。
拼凑信息这条路就比较随性了,用爬虫从各种网站上搜刮只言片语,配上经典的“小编体”,车轱辘话能把你绕出二里地。
小编体生成器
更高级的路线是机翻外网,它们最爱翻StackOverflow、GitHub这类网站,所以我们搜索科技、编程类的信息时,能经常会被机翻信息荼毒。
是个正常人都能看出来,内容农场100%是垃圾网站,为什么还能排在搜索引擎的第一页?
因为它们精通SEO技术,也就是searchengineoptimization,搜索引擎优化。简单来说就是,搜索引擎爱看什么,内容农场就做什么。
有人专门卖SEO课程
最弱智的“小编体”,本意不是给人看的,而是给搜索算法看的。每重复一次废话,就能在搜索权重里提高一点。量变产生质变,说的就是这个道理。
但是“每日头条”“壹读”这种服务器在国外的大型内容农场,走出了不同的路。
被原作者发现怎么办?这些网站屏蔽大陆IP,没点技术手段,原作者根本不知道自己的创作被盗用了。
02
营销号,互联网的“注水肉”
我们经常能看到各种“清朗行动”,每次出手都能精准封禁无良账号。这类无良帐号,大多属于营销号范畴。
营销号是互联网垃圾信息的2.0升级版,当内容农场还在无脑搬运时,营销号已经精通“原创”垃圾信息的高科技了。
“挂羊头”指的是特别唬人的标题和封面,早期经典套路是“震惊体”。其实很多媒体都喜欢用震惊体,毕竟人类的种族天赋是看热闹不嫌事大,谁不爱看大新闻呢?
在情绪价值当道的今天,标题套路也要输出强烈的情绪,像是“XX大厂,哭晕在厕所”“XX道歉了,但我不买账”,最好在封面图上给照片的眼部打码,更添一丝窥腥的爽感。
“卖狗肉”很好理解,正文内容简单直白兼具话题性,甚至无脑反智、造谣抹黑,复刻黄色新闻时代的“荣光”。
想识别营销号,其实很容易,从帐号名称、第一印象就能判断。必须说明,就算符合这些特征,也不一定100%是营销号,如有误伤,纯属活该。
首先从账号名称判断,“某人+某垂类”的组合是营销号的常用套路,什么“XX看球”“养生界XX”“XX八卦哥/姐”……。
完蛋,我又被包围了
如果是图文内容,只要看内容是不是空洞的车轱辘话就行。
视频更容易鉴定,开篇一句AI配音的“哈喽大家好,我是XXX,最近发生了一件很火的事情,我们一起来看看吧……”
好家伙,整个视频一共30秒,开头结尾的废话占了25秒。
如果BGM用的是久石让的《Summer》,听我的,朋友,快逃。
这群营销号批量制造信息垃圾,动力在哪里?因为真赚钱。
配合一些自动抓取内容的工具,批量起号并不难,困难的是如何注册大量帐号。我们都知道,注册帐号需要实名认证。所以搞营销号的人,必须在非法渠道买卖身份信息。
这种需求催生出一条灰色产业链,很多不懂互联网、缺乏隐私保护意识的老年人,就被骗子偷走身份,成了营销号链条里的受害者。
只要花点成本搭建起自动化工作流,营销号就能躺着赚钱。
自动化营销号有多可怕?2019年有报道说,营销号“show娱娱”被曝光时上传了23万个视频,假如普通人一天做3个视频,需要连续213年才能做出23万个视频。
后来上传了30万个视频
不管产业再怎么升级,也跑不赢营销号的步伐。
就像西西弗斯推石头,明知前方有无尽的阻碍,但从不放弃,荒诞同时值得尊敬。
03
提升垃圾内容的“品质”,全靠AI
最近有个神奇的社交软件Butterflies,在这里,AI才是本体,人类沦为工具人。
人类有什么用?打开软件、1分钟制作出AI角色,然后化身摄像头,欣赏AI们的丰富生活。
AI在做什么?疯狂发贴、发照片、转评赞,用996/007的强度享受赛博世界的美好生活。
在Butterflies里转一圈,有种牛马打工人围观财富自由人群吃喝玩乐的美。
也有“务实”的AI在银河下敲代码,人家AI打工也能颇具情调
不怕AI玩得比自己花,就怕AI跑出它们的圈子,到人类世界里秀操作。
上个月,谷歌的AI成了全世界的乐子。搜索“批萨上的奶酪掉下来怎么办”,谷歌AI会说“涂上无毒胶水”。
更离谱的是,真有人买了无毒胶水,按照谷歌AI的配方做了批萨,而且吃了。
省流版本:味道很好,人还健在
谷歌AI犯傻之后,字节的豆包大模型也整了个活,有人发现能在搜索引擎里能找到豆包和用户之间的对话。
意外收获还是有的,“豆包搜索引擎”这个关键词已经被SEO污染,点进去是一些卖奇怪器械的网站……
这个问题已经被修复
谷歌AI和豆包大模型的UI很明显,普通人能一眼识别,从而对它们的内容产生质疑。但有没有一种可能,AI生成的内容故意把自己伪装得人畜无害,故意混进我们的信息流里?
这种担忧,早已成真了。
基于Transformer架构的各种AI,最擅长一本正经胡说八道,简直是编写营销号的最佳工具。阅读这种工具生成的文字,感觉就像穿了冰丝内裤一样,丝滑流畅。
有人出售专门的营销号工具,也能一键生成视频
但你细品,就能发现一段几百字的小作文,其实毫无信息量,全是同义反复。见得多了,也就能大概猜出这是AI生成的内容。
实在分辨不出来,也有一些AI工具能辅助判断某段文字是不是AI生成。
AI正在判断AI生成的内容是不是AI生成,有点绕口令,而且挺魔幻的。
像是“地球越级升级”这个号,简直是神幻的集大成,托尔金、乔治·马丁他们都不敢这么写。
节选一段内容给大家品品:
这类帐号下边,很多顶着中老年头像的人频繁打赏。
其实想想,挺失落的。以前的骗子虽然可恶,但他们毕竟是有血有肉的人啊。现在连骗子都进化成硅基生命了,这个世界人情味,真是一代不如一代。
AI强势逐渐入侵互联网,大型多人在线狼人杀即将开始。
更麻烦的是,玩狼人杀,我们能从玩家的面部表情里寻找蛛丝马迹。但AI“真人出镜”,真假难辨。
几天前,马斯克的深度伪造视频频繁出现在YouTube直播平台,伪·马斯克号称直播送比特币,诱导不明所以的吃瓜老外点击链接,到骗子网站里当韭菜。
刚刚过去的618电商促销,有一堆数字人直播带货,它们是真007,永远不需要休息。但毕竟技术有限,当你发弹幕跟它们互动的时候,就像卡壳了一样,过半分钟才能收到一个文不对题的回复。
这些数字人直播间刚刚上线的时候,成交额爆表,但没过几天,成交额就跌到真人直播的20%。人味,仍然是直播带货的必备要素。
"兄弟宇宙创始人"也加入数字分身的行列
在2021年,“俄罗斯娜娜”和它的三姑六婆们集体攻占短视频平台。这些“伪人集团”操着塑料俄普,一口一个“中国的兄弟姐妹们,你们好”,疯狂带货赚钱。
其实它们根本不是俄罗斯人,而是100%原生态的本地老乡,利用AI换脸技术,把自己伪装成俄罗斯人的脸型,收割国人的爱国情怀。
“俄罗斯娜娜”的真身,其实是个男人
这种低级骗局能奏效,恰好说明大多数人分不清AIGC。
说了这么多AIGC的负面案例,好像AI都是洪水猛兽。其实不然,AI做好事的潜力无限大。
于是医生在一家数字人公司制作了“分身”,只需要确保文案准确,让“分身”出镜生成视频,极大提高传播正确医学科普的效率。
技术本身没有对错,有错的是想用技术作恶的人,以及背后的利益链条。
现在的互联网上,真实和虚假的信息混在一起,甚至虚假比真实更容易接受。不擦亮双眼,我们很容易陷入内容农场、营销号的泥潭里。