传播数据挖掘案例:“昆山龙哥反杀案”报告

越轨行为(deviance),是一个社会学概念,它是指违反一定社会的行为准则、价值观念或道德规范的行为或者对现有的社会规范和社会秩序(包括法律法规)进行反叛和质疑。

所以在社会学意义上,对越轨行为的评价就存在双面性,一方面越轨行为对社会的稳定性造成伤害被称为“恶性越轨”,另一方面则促进了社会的改革与发展被称为“良性越轨”。

根据理论框架,在昆山龙哥反杀案的事件中,民众普遍对我国刑法中有关“正当防卫”的判罚的既有规则表示不满,并且提出质疑和改变的需求,这种行为可以被当作一种越轨行为,理由如下:

第一,法律本身就是社会的规则,质疑它、否定它甚至要推翻它本身就已经构成了越轨行为;

第二,因为使用舆论手段干预司法,该行为本身是不符合判决独立原则的。但是该事件的结果却是促进了“正当防卫”判决向着较为人性化的方向发展,所以根据理论此次民众的网络越轨行为可被视为良性越轨行为;

同时,那些倡导“舆论不应该干预司法”以及“判决独立”的意见可以被视为反越轨行为。

越轨行为的研究在社会学中一直属于主流,它对社会制度的变革以及社会的问题起到非常重要的作用,其理论自然也就非常繁多。

根据本报告研究的事件——昆山龙哥反杀案,本研究选用其中最著名的理论——美国社会学家罗伯特莫顿的结构紧张理论。

该理论认为由于现存制度在政治、经济以及法律等方面的不完善,比如阶级偏向等,导致一部分社会底层群体被迫使用非法、非常规的手段来实现自己的个人目的。

本案中的龙哥其实就是这样的群体中的一员,而大众传媒在这种事件中起到的作用往往比较微妙,一方面部分民众会因为同情以及社会政治关怀而掀起网络上的二次越轨行为——对制度本身进行冲击,另一方面代表着社会控制的主要力量的官方媒体会在一定程度上对这种舆论进行控制。

在以上理论背景下,本研究提出以下三部分问题:

问题一:普通民众和主流官方媒体在微博上讨论该事件都有哪些主题?这些主题中到底蕴含了主流官方媒体或者民众什么样的态度?

问题二:普通民众对于该事件的参与程度如何的?这些民众的参与程度和他们的背景有无关联?

问题三:在此次事件的爆发和扩散的过程中,普通民众和官媒以及商业媒体的所讨论的主题是怎样演化的,三者之间的互动关系如何?

问题四:在此次事件中各个舆论主体中是否存在反越轨行为?如果存在效果如何?

这四个问题的提出都是基于一个前提假设即:具有官方背景的媒体、普通民众以及具有商业背景的媒体在本次事件的发酵过程中所讨论的主题以及所起到的作用是不同的。

本研究首先按照研究需要要对所有微博的背景进行分类,基于这些微博主体的属性将所有微博的主体分为以下几类:

第一类,官方媒体即包括具有官方背景和行政背景的媒体(如人民日报、新华社、法制晚报、海南网络广播电视台等)以及地方门户网站(如杭州网等)共350个;

第二类,各地的司法以及行政管理部门的官方微博(如昆山公安、抚顺网警巡查执法等),该类微博主体共146个;

第三类,大型商业媒体。主要为大门户网站的新闻版块(网易新闻客户端等),该类微博主体共48个;

第四类,外国媒体,共12个;

第五类,法律专业服务类媒体,包括律师所以及法律工作行业的网站等共6个;

第六类为除以上微博主体的剩余部分即普通民众,包括自媒体和个人用户。

所使用的方法为LDA主题模型,使用的工具为python的gensim包中的ldamodel函数。

先对各个类别的微博主体按照perplex指标约束生成符合实际情况的主题数量。然后,邀请具有传播学背景的志愿者按照传播学中框架分析的方法对每个主题进行标注,并使用spss软件中的α信度系数法计算信度,确定最终的主题含义。

第三,网络行动。该维度下的指标有:X8:是否参与网络投票。

在对以上信息进行统计之后,本研究需要对每个变量数值为前10的用户进行微博定位和背景分析,主要分析该用户以前发布的微博的文本特征。

问题三主要考察了各个类别主题的动态分布,发现各类微博主体的话题演化规律和各个类别之间主题语词的互动关系。

使用的方法为DTM(动态主题模型),所参考的文献为,工具为gensim库中的LdaSeqModel模型。

本研究综合考量perplex值以及理论背景最后确定官方媒体提取100个主题,各管理部门的官方微博提取100个主题,大型商业媒体提取80个主题,外国媒体提取30个主题,法律专业服务媒体提取30个主题,普通民众提取100个主题,并重点分析每个主题提取重要度前30的词汇。

主题经过志愿者的标注以及小组四人的共同审核后,六个类别的信度系数分别为:

表一各类媒体标注的信度系数

如果以0.6为选择标准的话,在所有标注类型中,法律专业服务类媒体的信度系数最低。

但是商业媒体则不然。首先在事件描述层面商业媒体更加开放和大胆,例如“大砍刀”、“血腥”等词汇屡次出现在商业媒体主题词的前几名,另外商业媒体更偏好挖掘受害人的故事,表达也更加情感化,并且带有强烈的道德审判和谴责。

其次,有相当一部分人还是认为这件事情推动了中国法律的进步,所以第11个类别频数较高。但是,在对事件主体的态度方面,普通民众就表现出斯图尔特·霍尔所谓的“对抗性”解读来,比如嘲笑龙哥的行为,乃至以江湖的视角为龙哥感到“惋惜”。我们甚至还发现前100个主题里面居然没有出现谴责龙哥的词语。

在事件解释的过程中,部分民众表达了对于现行法律和社会治安管理能力的强烈不满,所以数据统计中第8类和第9类主题的频数都呈现出比较高的趋势,代表词汇有“草菅人命”等,甚至提出“以暴制暴”。

关于外国媒体,由于其发布的微博数量非常之少,且看不出明显的主题倾向,因此无法进行概括分析。

考虑发布微博的数量,筛选出排名前10的微博主体,这些高发布数量的微博主体具有以下特征:

在社会学中,第一类人被称为初级越轨者,该类型的越轨者往往具有盲从的心理,他们不会主动发表意见,也不会对越轨行为本身进行深入思考;第二类人被称为次级越轨者,该类型的越轨者往往比较理性,会对越轨行为本身进行深入地思考且具有独立自主的判断能力。

另外,从有高转发量的原创微博数据中,或者从微热点给出的2018/8/27-2018/8/28报告中的核心传播人中,本研究都很难分析出该微博主体的人口统计学变量的集中特征。

这里的主题词是以文本的形式而非数值的形式出现的,所以使用Jaccard距离能够有效的适应文本数据的相似性度量问题。

表二各个微博主体的动态主题演化表

主要结论如下:

第三,官媒的议程设置能力最强。这与官媒在此类事件中具有在采访权方面的优势有关。

如果将倡导“判决独立”视为一种反越轨的行为,这说明民众的反越轨行为是失败的。

通过以上分析,本研究得出结论,在此次的良性越轨事件中:

但是本研究也有其局限性:

第二,本研究在多类型微博主体的演化模型的交互关系分析中缺乏严格的因果关系分析,这使得结论的精度有待于进一步提高。

第三,本研究的编码员数量过少,导致对于主题的标注的正确性有待于进一步提高。

图一对各类主题标注的总体框架

图二官方媒体(包括各地司法和行政管理部门的官方微博)的标注表

THE END
1.数据挖掘算法(AnalysisServices–数据挖掘)MicrosoftLearn为特定的业务任务选择最佳算法很有挑战性。您可以使用不同的算法来执行同样的业务任务,每个算法会生成不同的结果,而某些算法还会生成多种类型的结果。例如,您不仅可以将 Microsoft 决策数算法用于预测,而且还可以将它用作一种减少数据集的列数的方法,因为决策树能够识别出不影响最终挖掘模型的列。 https://technet.microsoft.com/zh-cn/library/ms175595(v=sql.100).aspx
2.数据挖掘案例分析数据挖掘应用20个案例分析数据挖掘案例分析 引言 数据挖掘是利用计算机算法从大量数据中提取有价值信息的科学。它已广泛应用于各个行业,以提高决策制定、识别趋势和优化流程。本文将探讨几个数据挖掘案例分析,展示其在现实世界中的应用。 案例1:零售业中的客户细分 ?问题:一家零售商希望了解其客户群,以便更好地针对营销活动。https://blog.csdn.net/a1234391/article/details/136669022
3.十个有趣的“大数据”经典数据挖掘案例腾讯云开发者社区十个有趣的“大数据”经典数据挖掘案例 马云说:互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。近两年,“大数据”这个词越来越为大众所熟悉,“大数据”一直是以高冷的形象出现在大众面前,面对大数据,相信许多人都一头雾水。下面我们通过十个经典案例,让大家实打实触摸一把“大数据https://cloud.tencent.com/developer/article/1040544
4.漫谈数据挖掘——经典案例赏析大家好,首先很感谢数据分析网的支持,提供这样一个平台,能够和大家一起分享、交流,今天主要给大家带来3个数据挖掘的经典案例。 一、产品精细化运营之道 运营的核心在于持续性改进,运营分析需要保证数据的精确与一致性;可以容忍一定程度上准确性的偏差。那么,准确和精确有什么区别呢? https://zhuanlan.zhihu.com/p/678971125
5.数据挖掘:你必须知道的32个经典案例首页 馆藏纸本 图书详情 数据挖掘 :你必须知道的32个经典案例 出版社:电子工业出版社 ISBN:9787121351129 出版年:2018 作者:任昱衡 资源类型:图书 细分类型:中文文献 收藏单位馆藏地在架状态索书号 自动化所图书流通库已借出F713.51/ 234 5浏览量 问图书管理员 https://www.las.ac.cn/front/book/detail?id=255a02b291370428cd51a7cd5e56f076
6.数据挖掘的经典案例有哪些帆软数字化转型知识库数据挖掘的经典案例有:市场篮子分析、信用评分、客户细分、欺诈检测、预测性维护、推荐系统、社交网络分析、文本挖掘。其中,市场篮子分析尤为重要。市场篮子分析利用数据挖掘技术,通过对购物篮中商品的频繁项集进行分析,找出商品之间的关联规则。例如,超市通过分析购物数据发现,购买牛奶的顾客更倾向于同时购买面包,这一发现https://www.fanruan.com/blog/article/594537/
7.机器学习找不到创新点?三种特征选择的方法包你拿下顶会!文章介绍了两种新的决策树框架LDATree和FoLDTree,它们结合了不相关线性判别分析(ULDA)和前向ULDA。这些方法能够高效地进行斜切分,处理缺失值,支持特征选择,并提供类标签和概率作为模型输出。通过在模拟和真实数据集上的评估,LDATree和FoLDTree在准确率上与随机森林相当,显示出作为传统单树方法的稳健替代方案的潜力。 https://www.bilibili.com/read/cv40067807
8.《正版书籍数据挖掘竞赛实战方法与案例许可乐清华大学出版社当当书海图书专营店在线销售正版《正版书籍 数据挖掘竞赛实战方法与案例 许可乐 清华大学出版社》。最新《正版书籍 数据挖掘竞赛实战方法与案例 许可乐 清华大学出版社》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《正版书籍 数据挖掘竞赛实战方法与http://product.dangdang.com/11885953688.html
9.数据挖掘应用(精选十篇)可视化方法是数据挖掘不可忽视的辅助技术。数据挖掘通常会涉及较复杂的数学方法和信息技术,为了方便用户理解和使用这类技术,必须借助图形、图像、动画等手段形象地指导操作、引导挖掘和表达结果等,否则很难推广普及数据挖掘技术。 4 数据挖掘的实施过程 数据挖掘的一般实施步骤如下: https://www.360wenmi.com/f/cnkeymoknlxl.html
10.数据挖掘:实用案例分析完整pdf扫描版[103MB]电子书下载《数据挖掘:实用案例分析》共12章,分三个部分。第一部分是基础篇(第1~4章),主要对数据挖掘的基本概念、应用分类、建模方法及常用的建模工具进行了介绍,并对本书所用到的数据挖掘建模平台TipDM进行了说明。第二部分是实战篇(第5~10章),以案例的形式对数据挖掘技术在金融、电信、电力、互联网、生产制造以及公共https://www.jb51.net/books/629234.html
11.数据运营是做什么(一文读懂“数据化运营”)一本好书会让人有读时恍然大悟,读后茅塞顿开的赶脚,最近我读了《数据化运营:系统方法与实践案例》这本书后就是这种感受,要是能合着《精益数据分析》一起“内服”,效果更佳,瞬间打通任督二脉,忍无可忍只好把读书笔记分享一波。提前预警!!!本文很干,请自备茶水! https://www.niaogebiji.com/article-492672-1.html
12.数据挖掘成功案例3篇.doc数据挖掘成功案例3篇.doc,数据挖掘成功案例3篇 篇一:数据挖掘应用成功案例 1电话收费和管理办法 加拿大BC省电话公司要求加拿大SimonFraser大学KDD研究组根据其拥有的十多年的客户数据,总结、分析并提出新的电话收费和管理办法,制定既有利于公司又有利于客户的优惠政策。 https://max.book118.com/html/2017/0118/84897835.shtm
13.数据挖掘实用案例分析PDF电子书数据挖掘 实用案例分析2016-12-14 上传大小:16.00MB 所需:50积分/C币立即下载 SPSS Modeler数据挖掘方法及应用_网盘链接下载85.25M SPSS Modeler数据挖掘方法及应用,本书主要特点: 1)以数据挖掘过程为线索介绍SPSS Modeler软件 2)数据挖掘方法,软件操作、案例分析的有机结合 3)数据挖掘方法讲解通俗,软件操作过程说明https://www.iteye.com/resource/qq_34736062-9711211
14.数据挖掘:你必须知道的32个经典案例Yami数据挖掘:你必须知道的32个经典案例, Brand: Jingdong book, Database-Yami. 100% authentic, 30-day return guarantee, authorized retailer, low price.https://www.yamibuy.com/en/goods.php?id=37352
15.研究生课程简介课程内容如下:管理研究基础—科学思维、问题提出、研究过程等;管理研究设计—理论构建、概念测量、“八股”结构及实证方法等;具体实证方法—问卷调查法、案例方法与二手数据研究等;数据的收集与处理—数据的收集、数据整理、数据的分析及统计软件使用等。通过本课程讲授、文献阅读、案例研讨与研究计划撰写,将会帮助学生https://it.uibe.edu.cn/yjsjx/pyfa_yjs/9e574703ee89482896894472223a3e3c.htm
16.数据挖掘聚类分析实例数据挖掘的常用方法、功能和一个聚类分析应用案例 在今天的博文中,笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,https://www.pianshen.com/article/74271139769/
17.李奇老师:数据分析师(用Excel玩转商业智能),CDA数据分析师出品4.销售管理分析仪制作方法介绍上 4.销售管理分析仪制作方法介绍下 第五周练习题 第五周练习题答案 第五周练习题答案及讲解 06第六周 统计分析基础及简单数据挖掘案例 1 1.描述性分析 1.描述性分析 6.1描述性分析上 6.1描述性分析下 2 2.浅谈回归分析 2.浅谈回归分析 2.浅谈回归分析 3 3.浅谈数据挖掘 第https://www.vipc6.com/338.html
18.临床研究数据分析与优质SCI论文写作发表培训班模块五 数据挖掘方法——分类与聚类 1、 分类的概念及分类的性能与评估 2、 决策树与随机森林分类器的构建及R软件实现 3、 决策树与随机森林结果的可视化 4、 主成分分析及应用主成分分析绘制分类图 5、 聚类的概念及常用聚类方法(K均值聚类与系统聚类) https://meeting.dxy.cn/article/616129
19.聚类分析在电商推荐系统中的应用案例数据挖掘技术在提高用户满意数据挖掘技术在提高用户满意度的实践 如何利用聚类分析提升电商平台的个性化推荐? 首先,了解客户行为是实现个性化推荐的关键。通过对历史交易和浏览记录进行深入分析,我们可以识别出不同客户群体的购买偏好。这就需要一种能够有效分类和分组这些复杂数据集的手段,而聚类分析正是这样一种工具。 https://www.topnu.cn/shang-ye-yan-jiu/151060.html
20.干货▏面向大数据的时空数据挖掘如上所述,时空数据挖掘的应用非常广泛,如交通运输、地质灾害监测与预防、气象研究、竞技体育、犯罪分析、公共卫生与医疗及社交网络应用等。这里我们简单介绍两个时空数据挖掘的应用案例,借此了解一下时空数据挖掘在现实生活中的实际应用。 案例一 - 时空数据分析预测 https://czj.guiyang.gov.cn/new_site/zwgk_5908373/zszc_5908415/202205/t20220531_74514473.html