传播数据挖掘案例:“昆山龙哥反杀案”报告

越轨行为(deviance),是一个社会学概念,它是指违反一定社会的行为准则、价值观念或道德规范的行为或者对现有的社会规范和社会秩序(包括法律法规)进行反叛和质疑。

所以在社会学意义上,对越轨行为的评价就存在双面性,一方面越轨行为对社会的稳定性造成伤害被称为“恶性越轨”,另一方面则促进了社会的改革与发展被称为“良性越轨”。

根据理论框架,在昆山龙哥反杀案的事件中,民众普遍对我国刑法中有关“正当防卫”的判罚的既有规则表示不满,并且提出质疑和改变的需求,这种行为可以被当作一种越轨行为,理由如下:

第一,法律本身就是社会的规则,质疑它、否定它甚至要推翻它本身就已经构成了越轨行为;

第二,因为使用舆论手段干预司法,该行为本身是不符合判决独立原则的。但是该事件的结果却是促进了“正当防卫”判决向着较为人性化的方向发展,所以根据理论此次民众的网络越轨行为可被视为良性越轨行为;

同时,那些倡导“舆论不应该干预司法”以及“判决独立”的意见可以被视为反越轨行为。

越轨行为的研究在社会学中一直属于主流,它对社会制度的变革以及社会的问题起到非常重要的作用,其理论自然也就非常繁多。

根据本报告研究的事件——昆山龙哥反杀案,本研究选用其中最著名的理论——美国社会学家罗伯特莫顿的结构紧张理论。

该理论认为由于现存制度在政治、经济以及法律等方面的不完善,比如阶级偏向等,导致一部分社会底层群体被迫使用非法、非常规的手段来实现自己的个人目的。

本案中的龙哥其实就是这样的群体中的一员,而大众传媒在这种事件中起到的作用往往比较微妙,一方面部分民众会因为同情以及社会政治关怀而掀起网络上的二次越轨行为——对制度本身进行冲击,另一方面代表着社会控制的主要力量的官方媒体会在一定程度上对这种舆论进行控制。

在以上理论背景下,本研究提出以下三部分问题:

问题一:普通民众和主流官方媒体在微博上讨论该事件都有哪些主题?这些主题中到底蕴含了主流官方媒体或者民众什么样的态度?

问题二:普通民众对于该事件的参与程度如何的?这些民众的参与程度和他们的背景有无关联?

问题三:在此次事件的爆发和扩散的过程中,普通民众和官媒以及商业媒体的所讨论的主题是怎样演化的,三者之间的互动关系如何?

问题四:在此次事件中各个舆论主体中是否存在反越轨行为?如果存在效果如何?

这四个问题的提出都是基于一个前提假设即:具有官方背景的媒体、普通民众以及具有商业背景的媒体在本次事件的发酵过程中所讨论的主题以及所起到的作用是不同的。

本研究首先按照研究需要要对所有微博的背景进行分类,基于这些微博主体的属性将所有微博的主体分为以下几类:

第一类,官方媒体即包括具有官方背景和行政背景的媒体(如人民日报、新华社、法制晚报、海南网络广播电视台等)以及地方门户网站(如杭州网等)共350个;

第二类,各地的司法以及行政管理部门的官方微博(如昆山公安、抚顺网警巡查执法等),该类微博主体共146个;

第三类,大型商业媒体。主要为大门户网站的新闻版块(网易新闻客户端等),该类微博主体共48个;

第四类,外国媒体,共12个;

第五类,法律专业服务类媒体,包括律师所以及法律工作行业的网站等共6个;

第六类为除以上微博主体的剩余部分即普通民众,包括自媒体和个人用户。

所使用的方法为LDA主题模型,使用的工具为python的gensim包中的ldamodel函数。

先对各个类别的微博主体按照perplex指标约束生成符合实际情况的主题数量。然后,邀请具有传播学背景的志愿者按照传播学中框架分析的方法对每个主题进行标注,并使用spss软件中的α信度系数法计算信度,确定最终的主题含义。

第三,网络行动。该维度下的指标有:X8:是否参与网络投票。

在对以上信息进行统计之后,本研究需要对每个变量数值为前10的用户进行微博定位和背景分析,主要分析该用户以前发布的微博的文本特征。

问题三主要考察了各个类别主题的动态分布,发现各类微博主体的话题演化规律和各个类别之间主题语词的互动关系。

使用的方法为DTM(动态主题模型),所参考的文献为,工具为gensim库中的LdaSeqModel模型。

本研究综合考量perplex值以及理论背景最后确定官方媒体提取100个主题,各管理部门的官方微博提取100个主题,大型商业媒体提取80个主题,外国媒体提取30个主题,法律专业服务媒体提取30个主题,普通民众提取100个主题,并重点分析每个主题提取重要度前30的词汇。

主题经过志愿者的标注以及小组四人的共同审核后,六个类别的信度系数分别为:

表一各类媒体标注的信度系数

如果以0.6为选择标准的话,在所有标注类型中,法律专业服务类媒体的信度系数最低。

但是商业媒体则不然。首先在事件描述层面商业媒体更加开放和大胆,例如“大砍刀”、“血腥”等词汇屡次出现在商业媒体主题词的前几名,另外商业媒体更偏好挖掘受害人的故事,表达也更加情感化,并且带有强烈的道德审判和谴责。

其次,有相当一部分人还是认为这件事情推动了中国法律的进步,所以第11个类别频数较高。但是,在对事件主体的态度方面,普通民众就表现出斯图尔特·霍尔所谓的“对抗性”解读来,比如嘲笑龙哥的行为,乃至以江湖的视角为龙哥感到“惋惜”。我们甚至还发现前100个主题里面居然没有出现谴责龙哥的词语。

在事件解释的过程中,部分民众表达了对于现行法律和社会治安管理能力的强烈不满,所以数据统计中第8类和第9类主题的频数都呈现出比较高的趋势,代表词汇有“草菅人命”等,甚至提出“以暴制暴”。

关于外国媒体,由于其发布的微博数量非常之少,且看不出明显的主题倾向,因此无法进行概括分析。

考虑发布微博的数量,筛选出排名前10的微博主体,这些高发布数量的微博主体具有以下特征:

在社会学中,第一类人被称为初级越轨者,该类型的越轨者往往具有盲从的心理,他们不会主动发表意见,也不会对越轨行为本身进行深入思考;第二类人被称为次级越轨者,该类型的越轨者往往比较理性,会对越轨行为本身进行深入地思考且具有独立自主的判断能力。

另外,从有高转发量的原创微博数据中,或者从微热点给出的2018/8/27-2018/8/28报告中的核心传播人中,本研究都很难分析出该微博主体的人口统计学变量的集中特征。

这里的主题词是以文本的形式而非数值的形式出现的,所以使用Jaccard距离能够有效的适应文本数据的相似性度量问题。

表二各个微博主体的动态主题演化表

主要结论如下:

第三,官媒的议程设置能力最强。这与官媒在此类事件中具有在采访权方面的优势有关。

如果将倡导“判决独立”视为一种反越轨的行为,这说明民众的反越轨行为是失败的。

通过以上分析,本研究得出结论,在此次的良性越轨事件中:

但是本研究也有其局限性:

第二,本研究在多类型微博主体的演化模型的交互关系分析中缺乏严格的因果关系分析,这使得结论的精度有待于进一步提高。

第三,本研究的编码员数量过少,导致对于主题的标注的正确性有待于进一步提高。

图一对各类主题标注的总体框架

图二官方媒体(包括各地司法和行政管理部门的官方微博)的标注表

THE END
1.数据挖掘类文章属于什么类型mob64ca12e83232的技术博客随着数据量的增长和技术的发展,数据挖掘的潜力将愈发显著。未来,数据挖掘将在决策支持、市场分析、个性化推荐等领域发挥更大的作用。 希望通过本篇文章,您对数据挖掘类文章的内容及其实现有了初步的了解。如需进一步学习,建议深入阅读相关领域的专业书籍与文献,探索更复杂和有趣的算法与技术。https://blog.51cto.com/u_16213397/12827058
2.数据挖掘算法实战:从传统统计到机器学习的商业智能分析完整技术栈通过数据挖掘算法,可以对用户的行为进行分析,包括用户偏好、购买行为、活跃度等,从而为企业的精准营销、产品推荐等提供支持。 风险管理 利用数据挖掘算法可以对风险进行识别和评估,包括信用风险、市场风险、操作风险等,帮助企业更好地进行风险管理和决策制定。 https://www.jianshu.com/p/e8efcaaf4349
3.中国建设银行申请数据分析方法相关专利,能解决无法及时有效识别和发专利摘要显示,本申请提供了一种数据分析方法、装置、设备、介质及产品。属于网络安全技术领域,该方法包括:获取各机构报送的各机构的从业人员的行为数据;对行为数据进行数据清洗和数据格式转换后,存入空白数据集中,得到行为数据集;采用关联规则挖掘算法挖掘行为数据集中行为数据之间的关联性,得到目标关联规则;根据聚类分析算https://www.163.com/dy/article/JJN5Q8DK0519QIKK.html
4.数字营销数据:深入挖掘价值在当今的数字时代,数据已经成为企业竞争力的重要组成部分。数字营销数据挖掘是一种利用大数据技术来分析和挖掘营销数据,以提高营销效果的方法。这篇文章将讨论数字营销数据挖掘的核心概念、算法原理、具体操作步骤以及数学模型公式。 1.1 数字营销数据挖掘的重要性 https://blog.csdn.net/universsky2015/article/details/135211815
5.浅谈数据挖掘中的个人信息保护【案例分析】 在“互联网+”时代下,传统行业能够突破自身局限走向终端智能化,升级用户体验,增强用户粘度,促进产品的全面提高,是未来获得新竞争优势的新动力。目前,各大企业都致力于搜集并分析用户数据,用以辅助经营决策。在数据挖掘的相关过程中,经常会涉及用户的个人信息和隐私。 http://media-ethic.ccnu.edu.cn/info/1168/2097.htm
6.数据挖掘与数据分析的异同点及典型应用案例在现代数据驱动的世界中,数据挖掘和数据分析已经成为了许多行业的重要工具。尽管这两个概念经常被人混淆,但它们各自有着独特的作用和应用场景。作为一个数据分析的从业者,我也曾在入门时对这两个术语感到困惑。经过实践,我逐渐发现了它们的异同,并且这些知识也帮助我在实际工作中做出更为精准的判断。 https://www.cda.cn/view/204806.html
7.数据挖掘应用(精选十篇)数据挖掘应用案例 篇2 康乃尔大学 Weill 医学院的研究者们,花了 18 个月的时间执行了一项大数据项目。他们用鉴识科学常用的棉花棒,在 486 个纽约地铁站搜集目标样本,车厢门、楼梯扶手、座椅、灯杆、垃圾桶都不放过,最后总共发现 1 万 5 千多种微生物,将近一半的样本是人类未知的有机生物,27% 是活性并俱有抗https://www.360wenmi.com/f/cnkeymoknlxl.html
8.数据分析报告(精选15篇)简单来说,数据挖掘是基于“归纳”的思路,从大量的数据中(因为是基于归纳的思路,因此数据量的大小很大程度上决定了数据挖掘结果的鲁棒性)寻找规律,为决策提供证据。从这种角度上来说,数据挖掘可能并不适合进行科学研究,因为从本质上来说,数据挖掘这个技术是不能证明因果的,以一个最典型的例子来说,例如数据挖掘技术https://www.ruiwen.com/fenxibaogao/8204699.html
9.数据挖掘应用案例分析,和数据挖掘应用案例分析的更多相关内容三个皮匠报告为您整理了关于数据挖掘应用案例分析的更多内容分享,帮助您更详细的了解数据挖掘应用案例分析,内容包括数据挖掘应用案例分析方面的资讯,以及数据挖掘应用案例分析方面的互联网报告,券商研究报告,国际英文报告,公司年报,招股说明书,行业精https://www.sgpjbg.com/labels/shujuwajueyingyonganlifenxi.html
10.生活中哪些数据挖掘的例子帆软数字化转型知识库电商平台如亚马逊、淘宝和京东利用数据挖掘技术来推荐商品。通过分析用户的浏览记录、购买历史、购物车内容和产品评价,平台能够生成个性化的推荐列表。这些推荐算法通常包括协同过滤、内容推荐和混合推荐等技术。亚马逊的推荐系统被认为是最成功的案例之一,它不仅通过用户行为数据推荐商品,还结合了其他用户的评价和购买记录,形https://www.fanruan.com/blog/article/600792/
11.数据挖掘成功案例3篇.doc数据挖掘成功案例3篇.doc,数据挖掘成功案例3篇 篇一:数据挖掘应用成功案例 1电话收费和管理办法 加拿大BC省电话公司要求加拿大SimonFraser大学KDD研究组根据其拥有的十多年的客户数据,总结、分析并提出新的电话收费和管理办法,制定既有利于公司又有利于客户的优惠政策。 https://max.book118.com/html/2017/0118/84897835.shtm
12.一小时了解数据挖掘②:分类算法的案例应用一小时了解数据挖掘②:分类算法的案例应用 关于本站 人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。 经管之家是国内活跃的在线教育咨询平台! 经管之家新媒体交易平台https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_3281329_1.html
13.哪些广为人知的数据挖掘案例其实是一地鸡毛?最近搜刮了几个典型案例,分别是啤酒与尿布、Google预测冬季流感、大数据预测纸牌屋、天气精准预报、股市K线预测,希望看了后于你有启示。 1、啤酒与尿布是数据挖掘最大的谎言 这个案例估计是数据挖掘界的头号代表。 全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来https://maimai.cn/article/detail?fid=828484229&efid=z9pS7vah5hirX3wsSkSEyQ
14.数据挖掘案例实战:利用LDA主题模型提醛东评论数据(二)专栏中的每四篇文章都是一个完整的数据挖掘案例。案例介绍的顺序是:首先通过数据案例背景提出挖掘目标,然后阐述分析方法和过程,最后完成模型构建,同时穿插操作培训,将相关知识点嵌入相应的操作过程中。 为了方便读者轻松获得真实的实验环境,本专栏使用了众所周知的实验环境Python语言处理样本数据进行挖掘和建模。 https://www.ruidan.com/infomation/detail/152869
15.《数字法治》刊发上海法院文章肖凯及小同牛元宏:从经验理性到数成文法体系中,案例参照制度作用机理的本质仍然在于推动制定法在司法适用过程中的协调统一,而非发起“遵循先例”的动议、直接作为司法机关调整社会关系的工具或方法论。换言之,司法机关对于类案的“参照”权力,并非源于法院的“造法”权能,仅隶属于法院的“适法”权能。这也是类案智能推送机制建设中必须厘清的前提性概https://www.thepaper.cn/newsDetail_forward_27785753