医患冲突的微博舆情议题建构地域化差异分析及情绪监测模型的建立

由中国新闻史学会计算传播学研究委员会与微热点大数据研究院联合举办的第二届传播数据挖掘竞赛已圆满落幕,15支战队尽显风采。以下为“基于新媒体传播数据的地域舆论环境感知”选题优秀作品《医患冲突的微博舆情议题建构、地域化差异分析及情绪监测模型的建立》,由来自汕头大学“开心开心幸福冲冲冲队”精彩呈现。

关键词:医患关系;网络舆论;地域特征;情绪指数模型;舆论预警

一、绪论

(一)研究背景及意义

1.研究背景

4月24日上海三甲医院仁济医院的胸外科的赵晓菁主任,当天正在出专家门诊。在接诊过程中,由于患者插队而与患者产生摩擦。警察赶到后,医生与警方发生口角,最终警方升级为强制传唤,赵晓菁主任被派出所民警带走问话。这一事件在网络平台上引发了大量用户以“医患关系”为核心的热烈讨论。由于群体极化效应,在“患者插队”的传言未被官方证实之前,热搜“手铐带走拒绝患者插队的医生”引发公众情绪,产生对警方的不满。但本文认为舆论最终焦点仍是反映社会当前的重要问题——医患矛盾这一症结上。

为了研究关于医患冲突事件,网民们的舆论是否存在地域差异性的参与特征和情绪倾向,以及网民会否因为所处的环境的经济水平、医疗水平等现实生活方面的差异而在网络舆论参与中产生的不同的话题倾向,展开讨论和研究。

2.研究意义

(二)研究内容

(三)研究方法

本文主要采用定性和定量的分析方法:包括内容分析法、关联度分析法、模糊综合评判法、PCA主成分分析法。

对事件舆情热度、情绪进行量化评价、分析,利用降维的思想、主成分分析方法,确定5个关于医患事件的核心舆论议题的评价矩阵和权向量,建立合理的评价模型。根据模型公式及其数学性质,给出模型的适用范围。为了进一步研究医患冲突事件的风险管控,本研究还参考了等级全息建模(HierarchicalHolographicModeling)的风险识别方法,以研究公共危机事件网络舆情风险管理。

二、大数据挖掘在研究中的应用

(一)数据预处理

数据预处理。在人工筛选后再对数据集进行机器清洗。本文使用Python-pandas、Numpy、re等对数据的基本信息进行统计、了解。包括:数据规格、标签、数据索引等。对数据中的认证类型、性别、地域进行分类,删除了所有带不明信息的数据,最终获得约351000条有效数据,并对数据的基本情况进行了描述性统计和可视化。由于部分地区数据较少以及研究对象的限制,本文的研究对象将排除港澳台等省市地区。

(二)数据处理

①事件关键词矩阵的生成

②建立各地区在各议题上的舆论情绪指数Hn,m的数学模型

其中a为满足条件PM的项数,n为地区代号。

为了研究不同省份在不同议题上舆论的情绪,建立各地区在各议题上的舆论情绪指数Hn,m数学模型:

其中n为地区代号,m为议题代号。

(一)我国各省医疗水平

医疗完善资源是指在一定社会经济条件下提供医疗服务的生产要素的总称,包括医务人员,医疗机构和医疗床位等资源和信息,其多寡也是衡量国家综合国力的一个重要指标。自新中国成立以来70年,我国在公共卫生领域获得了骄人的成就,平均预期寿命从不到35岁(1949年)上升到77.0岁(2018年),直接反映的是我国卫生医疗水平持续增长。

然而,我国是人口大国,幅员辽阔,医疗资源在时空上的分布不均一直是不可忽视的现实矛盾。而无论是在总量上还是在人均上,我国的的医疗卫生资源与其他发达国家相比仍有较大的差异。从一般印象来说,我国医疗卫生资源的空间分布呈现“东部总量高人均低,西部总量低人均高”的特点。但是为了更加详细客观地表现我国医疗卫生资源分布的现状,本文将通过建立省级医疗卫生资源标准化指标,对各省的医疗资源进行量化评分。

其中Yn为第m省份的医疗(人均/总量)量化得分,Ymi为第m省份的第i项参数,max(Yi)和min(Yi)分别是第i项参数的最大值和最小值。

对得出的数据进行可视化处理后得出各地区人均医疗资源分布图和各地区医疗资源总量分布图。如图1.1和图1.2所示:

与其说医患矛盾是医生和患者之间的矛盾,不如说是有限的医疗资源和近乎无限的医疗需求之间的矛盾。

(二)我国各省经济发展水平

经济发展水平也是衡量一个国家或地区综合实力的一个重要指标,反映了社会经济现象在不同时期的规模或水平。我国作为世界第二大经济体,自改革开放以来一直保持经济的中高速增长,更是在2019年人均GDP突破一万美元。不过由于人口基数庞大,各地区经济发展不均衡等因素,我国仍然属于中等收入的发展中国家。

虽然经济发展水平属于宏观概念,但是隐藏在其背后的众多因素切实影响着社会生活的方方面面。互联网和移动终端的普及、教育和医疗水平的提高,这一系列指标的提升,无疑与我国经济发展水平不断提高有显著关系。更重要的是,个人在互联网上对某事件的看法,有可能因其受教育水平或经济水平的影响,而在情感或观点上表现出区域差异。为了更加详细客观地表现我国经济发展现状分布的现状,本文将通过建立省级经济发展水平指标,对各省的经济水平进行量化评分。

其中Pn为第n省份的量化得分,Xni为第n省份的第i项参数,max(Xi)和min(Xi)分别是第i项参数的最大值和最小值。

对得出的数据进行可视化处理后得出各省份经济发展现状分布图。如图1.3所示:

四、医患关系舆情数据呈现与分析

(一)“仁济医院赵晓箐事件”网络舆情的总体特征

2019年4月25日,一则“上海仁济医院医生赵晓菁因拒绝接诊插队病人,被警方戴上手铐带走问话”的消息,引爆舆论。26日,当地警方通报称,网传患者陈某无理插队与事实不符,且医患双方确实发生冲突,警方口头传唤赵晓菁配合调查,在赵某拒不配合、并与处置民警发生肢体冲突的情况下,现场使用手铐强制传唤,符合法律规定。27日,医警双方接受采访时均称,处理上有提升空间,风波本可以避免。

下面将对医患冲突事件的每个议题(包括医疗体制、医院管理、患者素质、医疗资源和医生服务态度)进行进一步的分析,从细分议题的角度进行挖掘,以期总结出本次医患冲突事件的舆情倾向特性。

(二)“仁济医院赵晓箐事件”网络舆情的分议题情绪特征与分析

本文对五个议题的情绪得分进行主成分分析,研究在舆论中五大议题的情绪影响力高低。结果显示,医疗体制、医院管理、患者素质、医疗资源和医生服务态度分别占比53.36%、18.36%、11.27%、6.82%和6.07%。其中“医疗体制”议题对情绪评分的影响力占比最大,而“医生服务态度”议题的影响力占比最小。

1.医疗体制议题的舆情情绪特点

2.医院管理议题的舆情情绪特点

“医院管理”议题也是舆论讨论的重点。本次医患纠纷发生在仁济医院医院门诊,作为医患接触的一线,门诊是最容易发生矛盾与冲突的地方,医院更应加强对门诊的安保与管理工作。在本事件中,有舆论认为赵晓菁医生为维护就诊秩序与患者发生矛盾,但医院的安保人员却缺位,对医院的管理提出质疑。对此,网民认为医院应当派办公室人员或保安人员进行现场处置,而不能让专心看病的医生充当保安人员角色,卷入繁杂的排队管理事务中。医院管理需要从加强安保和完善诊疗制度两方面同时进行优化。

3.患者素质议题的舆情情绪特点

“患者素质”的情绪表现是5个议题中最消极的。本文在对医患冲突的舆论事件研究过程中发现,公共舆论已对医患冲突基本持有“医闹”这一先入为主的立场,即使在对事件过程尚未清楚的情况下,存在较多网民认为患者无理取闹在先。从词云图中常见“混蛋”“无赖”等贬义评价,对未有警方通报前传言“插队”的行为表示不满(此处“微笑”是网络表情,意为对医闹事件层出不穷感到讽刺、无奈、无语)。对此,网民认为需要有强制措施维持就诊秩序,患者需要尊重医生,遵守规则。

该议题的地区差异也最明显。其中,新疆、江西、广西对患者素质的舆论情绪消极程度一般,而其他医疗水平良好的地区如广东、北京、江苏,事发地上海,舆论情绪的消极度更高。后者属于经济发展较快的地区,信息传播渠道较为通畅,公民的收入和教育水平相对较高,相比于经济发展较为滞后的地区而言,更能理解医护人员,从医生的角度看待日益紧张的医患关系。可见,医患问题的舆论具有一定现实性的地域差异。

4.医疗资源议题的舆情情绪特点

不少网民认为医患冲突的症结是“医疗资源”不足和优秀医疗团队的在地域上的分布不均。即使同一地区,诊疗秩序、管理水平也参差不齐。在本次事件中,患者专程从东北某省赶至上海仁济医院就诊。跨省就医的存在,正是医疗资源不平衡的体现,却也直接挤压其他地区的医疗资源,助长了看病难的问题。

在现实中,北京作为我国首都,毋庸置疑拥有全国第一梯队的医疗资源水平,人均医疗水平最高,但对于“医疗资源”议题,北京网民却持有最高的消极情绪。词云图表示,患者“大老远”“从外地”到外地就医,医生还是需要“加班”“加号”才能满足患者的就医需求。这种矛盾,反映出医疗资源紧张是一个全国性的问题,舆论普遍对此表示不满。

5.医生服务态度议题的舆情情绪特点

在“看病难”问题普遍存在的现实中,由于医疗资源供需的不匹配,医护人员工作强度大的现象极为常见,无法保证患者的就医体验,这使患者对医生产生高高在上、没耐心、不够负责的印象,引起病患或病患家属不满。不过在此事件中,赵晓菁医生的评价多为良性评价,词云图中常见“专业”、“敬业”、“优秀”等正面词语。相当一部分网民认为需要理解医护人员的工作强度和职业难处,遵守秩序、多加配合。

(三)基于框架理论对舆论议题和情绪的分析

框架指的是人们用来认识和阐释外在客观世界的认知结构,它来自于个体过去实际生活的经验。是每个人在“存在、发生和意义这些问题上进行持续不断的选择、强调和表现时所使用的准则。而引入大众传播领域则表现为“媒介怎样反映现实并规范了人们对之的理解”,即议题、话语和意义是如何被准确建构、组织并得以展开的。

受众同样具有自己的框架。受众框架即受众个人接触和处理大众传播信息的认知结构和诠释规则,这种结构和规则来自于受众过去社会生活经验的积累、既有的价值观和态度、行为取向,并导引着受众个人处理新的信息。

五、监测模型建立与回测

(一)数据挖掘各阶段的应用

1.主成分分析

2.舆论指数监测模型建立

本文参照模糊数学中模糊综合评价法的思想,对舆情这种较客观的事物进行合理量化,而经查阅大量文献发现,评判舆情的指标主要集中在其烈度、广度、以及其所带主流情绪,依此我们建立如下舆论监测模型。

首先对上述处理得到的新数据集按议题切片,针对其情绪评分、及基本情况(包括数量、认证等级等)进行基于机器学习的主成分分析,把主成分分析的结果作为其权值,与五个议题的情绪得分矩阵进行运算,得出总体情绪综合评分HH。

(二)模型下放回测

六、医患冲突事件网络舆情的现实意义与管理建议

(1)预防进一步的舆情危机

建立完善的监测和预警机制,以应对医患冲突事件进一步恶化。舆论情绪监测模型为实时观测涉事人员和单位动态提供可能。此过程中,通过有效分析识别可能发生的危险,并提出预防措施,以便应对突发事件,降低甚至消除危机所发生的概率。

(2)为政府医疗体制改革聚焦痛点

医疗体制改革是我国医疗卫生事业发展的主推器,紧张的医患关系背后隐含的体制等民生问题在舆论情绪中有所体现。微博舆论此时充当谏言纳策的角色,及时从冲突事件中获取建议,如增加医疗财政投入、协调医疗资源的科学分配、医疗分配供给改革等,舆情监测可以为不同地方政府也能给予更精准的建议和参考。

(3)保护舆论事件涉事人员

根据预警,执法机关、行政单位、医院管理方和媒体都更应对涉事的医生、患者方及其他旁观者都进行更全面地采集证言,及时还原事件全貌,及早降低网络舆论的不确定性对涉事人员的伤害。预警信号推动事件透明公开的处理,有助于平息医患冲突舆情的升温。

(4)加强因地制宜的医院管理

各地的医疗、经济、文化发展程度不同,情绪监测模型包括了对医院管理的评分,各地医院参考事件本身和自身医院管理的具体情况作出适合,调整更符合自身的诊疗制度、加强安保维持秩序。

(5)媒体互动改善医患矛盾语境

新闻媒体除了避免报道把关不严、立场失位等原因的新闻媒体失范,减少医患冲突舆情发生反转,自媒体和新闻媒体都担当起应有的媒体责任和社会责任。在冲突矛盾的语境下,采用更客观、不带有情感倾向的报道,积极与政府单位、医院方进行多方冷静的传播互动,以改善事件发生进程的舆论情绪环境。

THE END
1.数据挖掘的分析方法可以划分为关联分析序列模式分析分类分析和数据挖掘是从大量数据中提取有用信息的方法,主要分为四种分析方式:关联分析、序列模式分析、分类分析和聚类分析。在本指南中,我们将详细介绍这四种方法的实现过程,并提供相应的代码示例。 数据挖掘流程 首先,我们需要明确数据挖掘的基本流程,如下表所示: 流程图 https://blog.51cto.com/u_16213297/12863680
2.数据挖掘的主要方法和技术数据挖掘的主要方法和技术包括数据清洗、数据预处理、数据可视化、数据分析、数据模型构建、数据评估和优化等。这些方法和技术可以帮助我们更好地理解数据,发现关键信息,并提高数据挖掘的效果。 在本文中,我们将详细介绍数据挖掘的主要方法和技术,包括数据清洗、数据预处理、数据可视化、数据分析、数据模型构建、数据评估和https://blog.csdn.net/universsky2015/article/details/137334966
3.数据挖掘主要挖掘方法的详细阐述逻辑回归分析是一种广泛应用于统计分析和数据挖掘中的回归分析方法。它主要用于处理因变量为二分类或多分类的回归问题。逻辑回归模型通过构建一个逻辑函数来描述自变量与因变量之间的非线性关系,并据此进行预测和分类。逻辑回归分析在医学、金融、市场营销等领域具有广泛的应用价值。 综上所述,数据挖掘的方法多种多样,每https://www.fanpusoft.com/fanpuerp/shujuku/886976.html
4.苏木亚及其学术专著《基于谱聚类的金融时间序列数据挖掘方法研究》其次利用矩阵理论、时间序列分析方法、多元统计方法和盲源分离模型提出了基于成分分析的单变量时间序列谱聚类方法;在实证分析部分,利用数据挖掘方法和GARCH、VAR、脉冲响应、方法分解、Granger因果检验模型、主成分分析法、独立成分分析法和Sharpe模型等对欧洲主权债务危机下全球主要股指的联动性和开放式基金的投资风格识别https://news.imu.edu.cn/info/1076/16128.htm
5.数据挖掘技术主要包括哪些?数据挖掘的技术,可分为:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法,可细分为:回归https://m.imooc.com/wenda/detail/508957
6.数据挖掘概念(AnalysisServices有关如何将 SQL Server 工具应用于业务方案的示例,请参阅数据挖掘基础教程。 定义问题 与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
7.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
8.数据挖掘VS机器学习,你了解多少?如今,获取数据比以往任何时候都更容易,但从数据中生成见解和信息正变得更具挑战性。企业经常发现自己处于一种情况,他们拥有的数据远远超过他们所知道的数据,这可能会适得其反,导致无所作为。 数据挖掘和机器学习是企业将这些庞大的数据库转化为有用信息的两种主要方法。 https://www.fromgeek.com/telecom/509859.html
9.数据挖掘论文常用的数据挖掘方法主要有决策树(Decision Tree)、遗传算法(Genetic Algorithms)、关联分析(Association Analysis).聚类分析(C~smr Analysis)、序列模式分析(Sequential Pattern)以及神经网络(Neural Networks)等。 三、数据挖掘的实际应用 由于数据挖掘市场还处于起步的阶段,但是发展很快。在国外有一些著名的大公司对数据挖https://www.unjs.com/lunwen/f/20220924130749_5650839.html
10.科学网—数据仓库和数据挖掘相关知识收集·前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。 对企业自身来说,数据仓库的建设是一个系统工程,是一个不断建立、发展、完善的过程,通常需要较长的时间。这就要求各企https://blog.sciencenet.cn/blog-1191257-807949.html
11.大数据金融第二章大数据相关技术指根据业务的需求和目的,运用合适的工具软件和数据挖掘方法对数据仓库中的数据信息进行处理,寻找出特定的数据规律或数据模式,得出有价值的信息和知识。 (二) 对象 数据挖掘的对象:根据信息存储格式,分为关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internethttps://www.jianshu.com/p/d68251554c66
12.数据挖掘七种常用的方法汇总腾讯云开发者社区聚类分群效果可以用向量数据之间的相似度来衡量,向量数据之间的相似度定义为两个向量之间的距离(实时向量数据与聚类中心向量数据),距离越近则相似度越大,即该实时向量数据归为某个聚类。 数据挖掘方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它https://cloud.tencent.com/developer/article/1892597
13.数据挖掘的主要方法有。A.编码B.分类C.聚类D.关联规则E.特征百度试题 题目数据挖掘的主要方法有 【】。 A.编码B.分类C.聚类D.关联规则E.特征分析相关知识点: 试题来源: 解析 BCDE 反馈 收藏 https://easylearn.baidu.com/edu-page/tiangong/bgkdetail?id=d20778dc8bd63186bcebbcd9&fr=search
14.网络营销全部59.数据挖掘分析方法中,聚类分析的主要目的是()。 A.找出数据之间的属性联系,形成关联规则B.把一组个体按照相似性归成若干类别,形成新的类标识C.把数据的关联性与时间联系起来,预测关联事件发生的时间D.根据示例数据库中的数据建立判别规则,据此对其他数据进行分类20.在企业【注释】:第十章第二节 第283页 聚类https://www.wjx.cn/xz/261160017.aspx
15.数据挖掘的挖掘方法是什么帆软数字化转型知识库数据挖掘的挖掘方法包括分类、回归、聚类、关联规则、序列模式、异常检测、降维、时间序列分析、神经网络和贝叶斯网络等。分类方法被广泛使用,因为它可以对数据进行标签分类,使得我们能够根据已有的标签预测新数据的类别。分类方法主要包括决策树、支持向量机、K近邻算法和朴素贝叶斯分类器等。例如,决策树通过构建树形模型,将https://www.fanruan.com/blog/article/593359/
16.常见的数据挖掘方法有()中级经济师考试题库常见的数据挖掘方法有()。 多选题常见的数据挖掘方法有()。 A 、结构化学习 B 、半监督学习 C 、监督学习 D 、无监督学习 E 、非结构化学习 扫码下载亿题库 精准题库快速提分 参考答案 【正确答案:B,C,D】 数据挖掘以解决实际问题为出发点,融合了多学科领域的知识,核心任务是对数据关系和特征进行探索。https://www.bkw.cn/tiku/Zdjbo.html
17.数据挖掘的常用方法都有哪些?而决策树方法也是数据挖掘的常用方法之一。决策树是一种常用于预测模型的算法,它通过一系列规则将大量数据有目的分类,从中找到一些有价值的、潜在的信息。它的主要优点是描述简单,分类速度快,易于理解、精度较高,特别适合大规模的数据处理,在知识发现系统中应用较广。它的主要缺点是很难基于多个变量组合发现规则。在数http://api.cda.cn/view/26507.html
18.数据分析中的文本挖掘有哪些方法实体识别是一种将文本中的命名实体提取出来的技术。命名实体通常是指人名、地名、机构名等有特定意义的词语。实体识别可以帮助人们了解文本数据中的重要信息和关系。实体识别的主要方法包括规则匹配、机器学习等。 综上所述,在进行文本挖掘之前,需要进行数据预处理,包括清洗数据、分词和建立词袋模型等。文本挖掘主要包括文https://www.linkflowtech.com/news/1588
19.高效实施数据挖掘的方法和步骤yuanye1014有了优秀方法论的指导,还需要一个高效的数据挖掘工具。目前提供数据挖掘产品的厂商非常多,如著名的产品有SAS Enterprise Miner、SPSS Clementine 8.1(简体中文版)、IBM DB2 Intelligent Mine等,这些产品各有特色。 选择一款适合的数据挖掘工具,主要从以下几方面来考虑。下面我们根据CRISP-DM方法论,从数据挖掘项目的各个阶http://blog.chinaunix.net/uid-64814-id-2690182.html
20.浅析数据挖掘的四种基本方法浅析数据挖掘的四种基本方法 我们生活在大数据时代,当今的互联网已经发展到大数据时代了,如今的信息技术从数据处理向数据分析和理解的方向一直在转变,如今企业都在不断的收集各种数据,从大数据中挖掘有用的数据信息,数据挖掘出有价值的数据。现在数据挖掘技术已经成为企业不可缺少的技术,需要收集海量的数据,从海量数据中https://www.kkidc.com/about/detail/hcid/196/id/1857.html