医患冲突的微博舆情议题建构地域化差异分析及情绪监测模型的建立|数据挖掘的主要方法_在线学习

由中国新闻史学会计算传播学研究委员会与微热点大数据研究院联合举办的第二届传播数据挖掘竞赛已圆满落幕，15支战队尽显风采。以下为“基于新媒体传播数据的地域舆论环境感知”选题优秀作品《医患冲突的微博舆情议题建构、地域化差异分析及情绪监测模型的建立》，由来自汕头大学“开心开心幸福冲冲冲队”精彩呈现。

关键词：医患关系；网络舆论；地域特征；情绪指数模型；舆论预警

一、绪论

（一）研究背景及意义

1.研究背景

4月24日上海三甲医院仁济医院的胸外科的赵晓菁主任，当天正在出专家门诊。在接诊过程中，由于患者插队而与患者产生摩擦。警察赶到后，医生与警方发生口角，最终警方升级为强制传唤，赵晓菁主任被派出所民警带走问话。这一事件在网络平台上引发了大量用户以“医患关系”为核心的热烈讨论。由于群体极化效应，在“患者插队”的传言未被官方证实之前，热搜“手铐带走拒绝患者插队的医生”引发公众情绪，产生对警方的不满。但本文认为舆论最终焦点仍是反映社会当前的重要问题——医患矛盾这一症结上。

为了研究关于医患冲突事件，网民们的舆论是否存在地域差异性的参与特征和情绪倾向，以及网民会否因为所处的环境的经济水平、医疗水平等现实生活方面的差异而在网络舆论参与中产生的不同的话题倾向，展开讨论和研究。

2.研究意义

（二）研究内容

（三）研究方法

本文主要采用定性和定量的分析方法：包括内容分析法、关联度分析法、模糊综合评判法、PCA主成分分析法。

对事件舆情热度、情绪进行量化评价、分析，利用降维的思想、主成分分析方法，确定5个关于医患事件的核心舆论议题的评价矩阵和权向量，建立合理的评价模型。根据模型公式及其数学性质，给出模型的适用范围。为了进一步研究医患冲突事件的风险管控，本研究还参考了等级全息建模(HierarchicalHolographicModeling)的风险识别方法，以研究公共危机事件网络舆情风险管理。

二、大数据挖掘在研究中的应用

（一）数据预处理

数据预处理。在人工筛选后再对数据集进行机器清洗。本文使用Python-pandas、Numpy、re等对数据的基本信息进行统计、了解。包括：数据规格、标签、数据索引等。对数据中的认证类型、性别、地域进行分类，删除了所有带不明信息的数据，最终获得约351000条有效数据，并对数据的基本情况进行了描述性统计和可视化。由于部分地区数据较少以及研究对象的限制，本文的研究对象将排除港澳台等省市地区。

（二）数据处理

①事件关键词矩阵的生成

②建立各地区在各议题上的舆论情绪指数Hn,m的数学模型

其中a为满足条件PM的项数，n为地区代号。

为了研究不同省份在不同议题上舆论的情绪，建立各地区在各议题上的舆论情绪指数Hn,m数学模型：

其中n为地区代号，m为议题代号。

（一）我国各省医疗水平

医疗完善资源是指在一定社会经济条件下提供医疗服务的生产要素的总称，包括医务人员，医疗机构和医疗床位等资源和信息，其多寡也是衡量国家综合国力的一个重要指标。自新中国成立以来70年，我国在公共卫生领域获得了骄人的成就，平均预期寿命从不到35岁（1949年）上升到77.0岁（2018年），直接反映的是我国卫生医疗水平持续增长。

然而，我国是人口大国，幅员辽阔，医疗资源在时空上的分布不均一直是不可忽视的现实矛盾。而无论是在总量上还是在人均上，我国的的医疗卫生资源与其他发达国家相比仍有较大的差异。从一般印象来说，我国医疗卫生资源的空间分布呈现“东部总量高人均低，西部总量低人均高”的特点。但是为了更加详细客观地表现我国医疗卫生资源分布的现状，本文将通过建立省级医疗卫生资源标准化指标，对各省的医疗资源进行量化评分。

其中Yn为第m省份的医疗（人均/总量）量化得分，Ymi为第m省份的第i项参数，max(Yi)和min(Yi)分别是第i项参数的最大值和最小值。

对得出的数据进行可视化处理后得出各地区人均医疗资源分布图和各地区医疗资源总量分布图。如图1.1和图1.2所示：

与其说医患矛盾是医生和患者之间的矛盾，不如说是有限的医疗资源和近乎无限的医疗需求之间的矛盾。

（二）我国各省经济发展水平

经济发展水平也是衡量一个国家或地区综合实力的一个重要指标，反映了社会经济现象在不同时期的规模或水平。我国作为世界第二大经济体，自改革开放以来一直保持经济的中高速增长，更是在2019年人均GDP突破一万美元。不过由于人口基数庞大，各地区经济发展不均衡等因素，我国仍然属于中等收入的发展中国家。

虽然经济发展水平属于宏观概念，但是隐藏在其背后的众多因素切实影响着社会生活的方方面面。互联网和移动终端的普及、教育和医疗水平的提高，这一系列指标的提升，无疑与我国经济发展水平不断提高有显著关系。更重要的是，个人在互联网上对某事件的看法，有可能因其受教育水平或经济水平的影响，而在情感或观点上表现出区域差异。为了更加详细客观地表现我国经济发展现状分布的现状，本文将通过建立省级经济发展水平指标，对各省的经济水平进行量化评分。

其中Pn为第n省份的量化得分，Xni为第n省份的第i项参数，max(Xi)和min(Xi)分别是第i项参数的最大值和最小值。

对得出的数据进行可视化处理后得出各省份经济发展现状分布图。如图1.3所示：

四、医患关系舆情数据呈现与分析

（一）“仁济医院赵晓箐事件”网络舆情的总体特征

2019年4月25日，一则“上海仁济医院医生赵晓菁因拒绝接诊插队病人，被警方戴上手铐带走问话”的消息，引爆舆论。26日，当地警方通报称，网传患者陈某无理插队与事实不符，且医患双方确实发生冲突，警方口头传唤赵晓菁配合调查，在赵某拒不配合、并与处置民警发生肢体冲突的情况下，现场使用手铐强制传唤，符合法律规定。27日，医警双方接受采访时均称，处理上有提升空间，风波本可以避免。

下面将对医患冲突事件的每个议题（包括医疗体制、医院管理、患者素质、医疗资源和医生服务态度）进行进一步的分析，从细分议题的角度进行挖掘，以期总结出本次医患冲突事件的舆情倾向特性。

（二）“仁济医院赵晓箐事件”网络舆情的分议题情绪特征与分析

本文对五个议题的情绪得分进行主成分分析，研究在舆论中五大议题的情绪影响力高低。结果显示，医疗体制、医院管理、患者素质、医疗资源和医生服务态度分别占比53.36%、18.36%、11.27%、6.82%和6.07%。其中“医疗体制”议题对情绪评分的影响力占比最大，而“医生服务态度”议题的影响力占比最小。

1.医疗体制议题的舆情情绪特点

2.医院管理议题的舆情情绪特点

“医院管理”议题也是舆论讨论的重点。本次医患纠纷发生在仁济医院医院门诊，作为医患接触的一线，门诊是最容易发生矛盾与冲突的地方，医院更应加强对门诊的安保与管理工作。在本事件中，有舆论认为赵晓菁医生为维护就诊秩序与患者发生矛盾，但医院的安保人员却缺位，对医院的管理提出质疑。对此，网民认为医院应当派办公室人员或保安人员进行现场处置，而不能让专心看病的医生充当保安人员角色，卷入繁杂的排队管理事务中。医院管理需要从加强安保和完善诊疗制度两方面同时进行优化。

3.患者素质议题的舆情情绪特点

“患者素质”的情绪表现是5个议题中最消极的。本文在对医患冲突的舆论事件研究过程中发现，公共舆论已对医患冲突基本持有“医闹”这一先入为主的立场，即使在对事件过程尚未清楚的情况下，存在较多网民认为患者无理取闹在先。从词云图中常见“混蛋”“无赖”等贬义评价，对未有警方通报前传言“插队”的行为表示不满（此处“微笑”是网络表情，意为对医闹事件层出不穷感到讽刺、无奈、无语）。对此，网民认为需要有强制措施维持就诊秩序，患者需要尊重医生，遵守规则。

该议题的地区差异也最明显。其中，新疆、江西、广西对患者素质的舆论情绪消极程度一般，而其他医疗水平良好的地区如广东、北京、江苏，事发地上海，舆论情绪的消极度更高。后者属于经济发展较快的地区，信息传播渠道较为通畅，公民的收入和教育水平相对较高，相比于经济发展较为滞后的地区而言，更能理解医护人员，从医生的角度看待日益紧张的医患关系。可见，医患问题的舆论具有一定现实性的地域差异。

4.医疗资源议题的舆情情绪特点

不少网民认为医患冲突的症结是“医疗资源”不足和优秀医疗团队的在地域上的分布不均。即使同一地区，诊疗秩序、管理水平也参差不齐。在本次事件中，患者专程从东北某省赶至上海仁济医院就诊。跨省就医的存在，正是医疗资源不平衡的体现，却也直接挤压其他地区的医疗资源，助长了看病难的问题。

在现实中，北京作为我国首都，毋庸置疑拥有全国第一梯队的医疗资源水平，人均医疗水平最高，但对于“医疗资源”议题，北京网民却持有最高的消极情绪。词云图表示，患者“大老远”“从外地”到外地就医，医生还是需要“加班”“加号”才能满足患者的就医需求。这种矛盾，反映出医疗资源紧张是一个全国性的问题，舆论普遍对此表示不满。

5.医生服务态度议题的舆情情绪特点

在“看病难”问题普遍存在的现实中，由于医疗资源供需的不匹配，医护人员工作强度大的现象极为常见，无法保证患者的就医体验，这使患者对医生产生高高在上、没耐心、不够负责的印象，引起病患或病患家属不满。不过在此事件中，赵晓菁医生的评价多为良性评价，词云图中常见“专业”、“敬业”、“优秀”等正面词语。相当一部分网民认为需要理解医护人员的工作强度和职业难处，遵守秩序、多加配合。

（三）基于框架理论对舆论议题和情绪的分析

框架指的是人们用来认识和阐释外在客观世界的认知结构，它来自于个体过去实际生活的经验。是每个人在“存在、发生和意义这些问题上进行持续不断的选择、强调和表现时所使用的准则。而引入大众传播领域则表现为“媒介怎样反映现实并规范了人们对之的理解”，即议题、话语和意义是如何被准确建构、组织并得以展开的。

受众同样具有自己的框架。受众框架即受众个人接触和处理大众传播信息的认知结构和诠释规则，这种结构和规则来自于受众过去社会生活经验的积累、既有的价值观和态度、行为取向，并导引着受众个人处理新的信息。

五、监测模型建立与回测

（一）数据挖掘各阶段的应用

1.主成分分析

2.舆论指数监测模型建立

本文参照模糊数学中模糊综合评价法的思想，对舆情这种较客观的事物进行合理量化，而经查阅大量文献发现，评判舆情的指标主要集中在其烈度、广度、以及其所带主流情绪，依此我们建立如下舆论监测模型。

首先对上述处理得到的新数据集按议题切片，针对其情绪评分、及基本情况（包括数量、认证等级等）进行基于机器学习的主成分分析，把主成分分析的结果作为其权值，与五个议题的情绪得分矩阵进行运算，得出总体情绪综合评分HH。

（二）模型下放回测

六、医患冲突事件网络舆情的现实意义与管理建议

(1)预防进一步的舆情危机

建立完善的监测和预警机制，以应对医患冲突事件进一步恶化。舆论情绪监测模型为实时观测涉事人员和单位动态提供可能。此过程中，通过有效分析识别可能发生的危险，并提出预防措施，以便应对突发事件，降低甚至消除危机所发生的概率。

(2)为政府医疗体制改革聚焦痛点

医疗体制改革是我国医疗卫生事业发展的主推器，紧张的医患关系背后隐含的体制等民生问题在舆论情绪中有所体现。微博舆论此时充当谏言纳策的角色，及时从冲突事件中获取建议，如增加医疗财政投入、协调医疗资源的科学分配、医疗分配供给改革等，舆情监测可以为不同地方政府也能给予更精准的建议和参考。

(3)保护舆论事件涉事人员

根据预警，执法机关、行政单位、医院管理方和媒体都更应对涉事的医生、患者方及其他旁观者都进行更全面地采集证言，及时还原事件全貌，及早降低网络舆论的不确定性对涉事人员的伤害。预警信号推动事件透明公开的处理，有助于平息医患冲突舆情的升温。

(4)加强因地制宜的医院管理

各地的医疗、经济、文化发展程度不同，情绪监测模型包括了对医院管理的评分，各地医院参考事件本身和自身医院管理的具体情况作出适合，调整更符合自身的诊疗制度、加强安保维持秩序。

(5)媒体互动改善医患矛盾语境

新闻媒体除了避免报道把关不严、立场失位等原因的新闻媒体失范，减少医患冲突舆情发生反转，自媒体和新闻媒体都担当起应有的媒体责任和社会责任。在冲突矛盾的语境下，采用更客观、不带有情感倾向的报道，积极与政府单位、医院方进行多方冷静的传播互动，以改善事件发生进程的舆论情绪环境。

THE END

医患冲突的微博舆情议题建构地域化差异分析及情绪监测模型的建立

数据挖掘的定义

关于数据挖掘，你必须知道的几个主要方法

医患冲突的微博舆情议题建构地域化差异分析及情绪监测模型的建立

大数据环境下审计技术方法研究审计科研专题专栏

数据挖掘的四种基本方法

数据挖掘最常见的十种方法

汽车金融风险分析范文

跨境电商数据挖掘的工具和方法（一）

MOOC慕课《从自然世界到智能时代》学习笔记

数据挖掘的常见方法mysql教程

CDALEVELⅡ?数据分析师考试?纲