内容提要:高质量的问卷调查方法应用与高质量的研究成果相辅相成。问卷调查作为国内外社会科学研究和政策评估的重要方法,随着经济社会发展、研究视野和议题的延展,以及竞争性方法的冲击,其生命力与竞争力遭遇一定程度的危机,进而带来方法弱化与替代、方法不信任与应用偏倚。作为方法规范性和有效性的前提保障,问卷调查的质量提升驱动着问卷方法的科学运用。本文围绕问卷设计和调查方案设计两个面向,对21世纪以来问卷调查中技术提升、方法交叉、工具运用等多元路径进行系统梳理与全面审视,并反思研究方法创新带来的“未预期后果”,进而阐释持续优化问卷调查方法的原则与可行方案,辨析新时代问卷调查方法何以持续贡献于社会科学的学科建设和知识生产。
关键词:问卷设计质量;调查方案设计质量;信度;效度
作者简介:臧雷振,中国农业大学人文与发展学院教授、北京大学国家治理研究院研究员;徐榕,中国农业大学人文与发展学院博士研究生
一、引言
问卷调查是社会科学研究的经典方法之一,为社会科学知识增量作出了重要贡献,为现代社会科学学科体系、学术体系、话语体系建设与完善提供了有力支撑。社会科学的理论构建与知识创新,社会科学研究中描述、解释、评估与预测功能的有效实现均离不开问卷调查方法的支持。但随着社会科学研究方法的更新迭代,传统的问卷调查方法受到不同程度的冲击。问卷能否更客观地还原研究对象的真实想法?能否更真实地呈现研究群体的整体特征?能否更准确地反映不同文化背景的差异?这一系列问题持续困扰着研究者,使该方法的信度与效度不断遭受质疑。
政治、经济、社会变迁和学术研究视野、范围的拓展,在强化上述疑问的同时也给问卷调查方法带来新挑战。例如,入户面访成本和拒访率的持续提升增加了信息采集难度;问卷调查方法满足部分群体(如流动人口)、特殊环境(如战乱)调查诉求的效果受到质疑;普遍信任水平下降或敏感性议题增加,“单位无应答”和“项目无应答”现象影响了数据结构;传染病防控阶段社交距离与人口流动限制增加了调查实施难度……有的是老问题以新形态呈现,有的是新时代新问题。这些问题和挑战构成新时代问卷调查方法的认可危机,关乎时代更迭下方法的生命力。
可以说,以上问卷调查方法所受质疑和挑战,以及竞争性方法的冲击,一定程度上削弱了问卷调查方法的“合法性”,实质降低了其在社会科学研究中的生命力与竞争力,甚至造成了方法的生存危机(见图1)。
高质量的问卷调查方法应用与高质量的研究相辅相成。如高质量的问卷调查设计能更有效地降低被访者的无应答率,进而规避数据缺损、测量误差的问题,且能对问卷调查其他环节存在的问题提前进行干预与预防。本文聚焦问卷调查设计阶段,呈现了21世纪以来问卷调查方法发展的学术理路,探讨在社会科学研究持续深入和经济社会不断发展的背景下,新时代问卷调查方法该如何保持旺盛的生命力和竞争力。下文介绍问卷调查设计质量的两个维度,分析其所面临的复杂现实挑战;进而从不同视角辨析21世纪以来提升问卷调查设计质量的多元路径,并通过对不同路径进行反思性比较,提出进一步提升问卷调查设计质量可遵循的原则和可行方案。
二、方法论危机下的问卷调查:维度与挑战
复杂性社会科学兴起的背景下,问卷调查方法依然面临严峻挑战,已有问卷调查设计难以满足研究需求,加剧了研究信度与效度所受质疑。本部分将明确问卷调查设计所含两个维度,系统梳理不同环节面临的质量危机及其后果,为后文问卷调查设计质量提升的效用与贡献分析提供参照。
(一)问卷设计与调查方案设计:质量提升的两个维度
问卷调查旨在通过收集大量个体特征信息,实现对总体的统计描述。罗伯特·M.格罗夫斯(RobertM.Groves)等在《调查方法》一书中指出这一过程涉及两个“推论步骤”:一是基于被访者对访题的应答推论其特征,二是基于样本特征推论总体特征。步骤一可能出现观察误差(errorofobservation),即被访者应答与期待测量的属性间的偏差;步骤二可能出现非观察误差(errorofnon-observation),即样本统计值与总体间的偏差。高质量的问卷调查,需要有效克服两类误差。基于此,格罗夫斯等提出了从“测量”和“代表性”两个维度建立调查设计和质量评估的框架(格罗夫斯等,2017:33-35)。
聚焦问卷调查设计阶段,为呼应“测量”与“代表性”,以及进一步实现对两个维度的划分,本研究区分了“问卷设计”“调查方案设计”两个维度(见图2)。“问卷设计”主要对应推论步骤一,主要呼应“测量”,兼顾“代表性”,讨论如何形成一份能实现特定研究目的的调查问卷,包括测量指标建构、问卷结构设计和问卷设计质量评估等环节,从而应对观察误差和非观察误差中的无应答误差。“调查方案设计”对应推论步骤二,呼应“代表性”维度,包括保证研究对象代表性、可及性和方案适用性等环节,讨论在调查开展中如何进行样本框编制和科学抽样设计、选择合适调查工具,形成一套能满足研究需要的调查方案,从而应对非观察误差(主要是覆盖误差和抽样误差)。
(二)痼疾与新症:问卷调查设计的质量挑战与方法论危机
在解决测量与代表性问题的问卷调查设计方法不断优化的同时,多维度的质量危机和认同危机不断凸显,问卷设计和调查方案设计面临更多考验。
1.问卷设计的质量挑战
问卷调查方法运用过程中,问卷设计一直面临着难以彻底解决的“痼疾”。例如,所选测量指标是否能保证较高的构念效度;敏感性问题测量中能否消减社会期望偏差(socialdesirabilitybias);能否科学评估已成型问卷测量的信度、效度,并对其做适度修正等。特别是答案设置、敏感问题测量等环节尚无定法,仍处于技术手段探索与检验阶段。
其次,随着针对传统议题有更多样的测量指标可供选择,当研究者主观选择的测量指标不能较好反映研究议题,就会导致测量指标的选择性偏差;由于经济、社会、政治条件的限制,部分研究议题所选替代性指标如果不可行,同样可能降低测量的构念效度。
再次,21世纪以来创新性工具的运用也提升了问卷测量的复杂性。不同调查工具,其问卷设计具有显著差异。例如,智能手机问卷与电脑问卷设计原则不同,受设备影响,前者需要更为简单的问题类型和应答方式(Antounetal.,2018),问题设计与工具的错配也会影响问卷设计质量。综合起来,面对痼疾与新症,在问卷设计的多个环节,问卷质量均可能会受到影响(见表1)。
2.调查方案设计的质量挑战
调查方案质量关系到问卷工具能否获得具有代表性的数据,同样关乎问卷调查方法的质量控制。比如,所采取抽样框总体和样本能否准确反映目标总体和样本框总体的特征,所设计调查方案是否适应实际调查条件等。
混合数据采集模式的运用不断拓展,有助于进一步实现降低问卷调查成本、覆盖调查对象等目标(Couper,2011)。但多重采集工具的使用却可能提升测量误差的复杂程度;且网络测验和纸笔测验等不同调查环境或模式中,使用同一测量量表,可能并没有很好的测量不变性(蔡华俭等,2008;方佳明、闻超,2013),造成借助不同工具所获数据难以混合和比较。
此外,跨国比较研究中社会文化情境差异,逐步走入研究视野的特征群体,民族区域、战争与群体运动等特定情境都对调查方案形成较大挑战。研究内容的多样化也给调查实施主体选择带来更多考验。例如,比较政治学研究中私人主体难以有效收集跨国数据,特别是仅能从不同国家内部获得的数据。私人主体的数据收集还可能造成收集方法不透明,使数据质量难以评估(Schedler,2012)。总结起来,调查方案设计质量所受挑战如表2所示。
(三)方法论危机中的问卷调查
“调查研究正处于十字路口。近年来,追踪公众行为、经历、需求和偏好的信息需求急剧上升……同时,开展高质量调查的挑战是巨大的。”(Krosnicketal.,2015:18)21世纪以来,问卷质量和调查方案质量所受挑战,一定程度削弱了方法的合法性,具体表现如下。
1.方法弱化与替代
问卷调查设计在各环节所面临挑战的多元化、复杂化,使问卷方法在一些社会科学研究中所扮演的角色式微。21世纪以来,社会学的“问卷热”已逐渐消退,代之以方法多元化运用和混合研究的发展。面对问卷调查设计所遭受的挑战,越来越多研究者更依赖现有大型统计调查数据(如CSS、CGSS、CFPS和政府公开的统计数据),而非亲自投身问卷调查实践,使研究问题与现有二手数据间契合性难以得到充分保障。一些研究问题无从获得数据支持,也在一定程度上限制了社会科学知识生产的广度。
2.方法不信任与应用偏倚
不同方法所受的质疑,使研究者对研究方法的选择更为谨慎,一定程度上不会再盲目相信只要选择某一方法就会有很高的研究效用。但是,问卷设计和调查方案设计所带来的质量问题,也令一些研究者对问卷调查方法的运用效果、适合主题形成刻板印象,甚至产生了较为盲目的方法不信任。区别于对理论适用性的质疑和经验素材真实性的不确定性,此种不信任是对问卷调查方法运用和基于问卷的知识生产的不信任。
三、问卷调查方法质量提升路径一:问卷设计的维度
近年来,国内外学者对如何提升问卷设计质量进行了充分讨论,提出了诸多针对性方案,可以提炼为以下三条路径:技术提升、方法交叉和工具运用。
(一)技术提升:经验积累如何使问卷设计推陈出新?
调查实践中的困难与经验教训的积累是问卷设计不断完善的第一驱动力,促使研究者持续反思问卷设计现有方法,不断促进问卷设计技术提升。
一是虚拟情境锚定法和列表实验设计等方法的提出和运用。为提升敏感问题、主观问题的测度信度与效度,研究者创新了一系列行之有效的问卷设计方法。通过将评价参照系和虚拟情境结合,虚拟情境锚定法可同时解决无参照系所致偏差和被访者难以理解复杂抽象概念的测量难题(严洁,2018)。有学者在实验研究中发现,测量政治效能感时,使用虚拟情境锚定法有助于解决使用传统方法时出现的测量偏差问题(刘小青,2012)。列表实验、背书实验等广泛用于测量被访者对易受社会期望偏差影响的敏感话题的真实态度(Rosenfeldetal.,2016),一定程度上解决了问卷调查中的“心理二重区域”现象,即被访者因不想公开“心理区域”而掩盖真相(李强,2000),从而一定程度上提高了敏感问题的测量效度。
二是工具性题目的设计与图片的运用。自填式问卷中,指示性回答项目(instructedresponseitems)被用于检查被访者注意力是否集中(Gummer&Silber,2021),为清理低质量问卷提供参考。问题前增加随机的陌生人图片,可避免测量普遍信任时,被访者仍基于对熟识者的印象作答,还能通过更换图片测量其对不同族裔陌生人信任程度的差异(Robbins,2022)。
列表实验、虚拟情境锚定法、工具性题目等在提升测量质量的同时,也对问卷项目布局及长度控制提出更高要求。随着网络问卷长度增加,参与和完成问卷的被访者均会减少,且相较于问卷前部分的应答质量,后部分应答质量会较低(Galesic&Bosnjak,2009)。因此,一方面需控制问卷长度,可通过创建信度与效度相近的短版本问卷以适应调查情境(Schreppetal.,2017),减轻问卷过长对应答率与应答质量的负影响;另一方面需进一步优化问卷项目布局。比如,实验问题置于问卷开头时,其应答质量会高于放置在结尾时(Neuert,2021),因此,较为复杂的问题可能更需放置在前面。
此外,方法创新在很多情况下也意味着问卷设计更为复杂,这会提高对被访者认知能力等方面的要求,限制方法使用范围。列表实验降低被访者策略性误报(strategicmisreporting)的同时,其复杂性也可能提升非策略性误报(nonstrategicmisreporting)(Kuhn&Vivyan,2022)。同样,由于情境题题干较长或者涉及维度较多,被访者受教育水平和认知功能会显著正向影响其应答质量,这需纳入对方法选择的考量(吴琼、张沛康,2019)。被访者健康程度与问卷应答质量间的正向关系(Schanze,2021)也提示研究者在运用新方法时,需审慎考虑其对研究对象的适用性。问卷设计创新方法的恰当运用能否契合调查对象实际条件,需要不断的实验或调查实践的验证。
(二)方法交叉:现象学努力如何再造问卷设计?
近年来,关于“现象学努力”对问卷设计影响的认识,随讨论深入而逐渐加深。首先,问卷设计中对定性方法的运用不断深入。加芬克尔(Garfinkel)的咨询实验表明,被访者的意义解释体系不会完整、现成地展示给调查者,问卷调查需避免将虚假意义体系强加其上。这需要打破问卷设计中从研究者到被研究者单向度的不平等关系,为双方的互动与表达提供更充分空间,使双方积极合作、相互理解。在研究有较强地域文化特征的问题时,可不根据既有理论设计指标,通过与调查对象的开放交流,分析其话语中蕴含的观念,形成参与式指标(Firchow&MacGinty,2020),从而将调查者更平等地纳入问卷设计中,发挥其对问卷的积极作用。
(三)工具运用:科学事实如何为问卷设计提供支持?
依托科学工具所形成的科学事实,为问卷设计提供了越来越扎实的事实依据。实验工具、数理工具乃至通信媒体工具运用在其中的作用不断凸显。
其三,通信媒体工具的辅助。相对于纸质问卷,网络问卷设计中通信媒体工具的优势得到更充分发挥。研究者可充分运用其技术优势,如网络平台样本检测、自动跳转、数据检测等(余富强等,2019),使问卷设计更为丰富多样,更好满足调查需求。一系列新软件和新系统的研发与推广,为研究者设计和使用高质量的非纸质问卷提供了技术支持。比如,以LimeSurvey为代表的网络调查开源软件工具、OmniSurvey移动面访系统等。
需要指出,虽然实验工具能以较低研究成本辅助改进问卷设计,也能为有效性检验提供事实证据,但其以科学精巧的高质量实验设计为前提,否则实验证据的信度与效度难以保障,这也一定程度上提升了方法使用门槛。与之类似,数理工具运用以掌握数理统计方法为前提,也具有一定使用门槛。更重要的是,通信媒体工具运用在丰富问卷设计的同时,也可能造成问卷问题有效性的变化,一些问题在某些调查工具中可能“失灵”。知识性问题常用于衡量被访者对调查主题的认知能力和记忆能力,但自填式网络问卷可能会加剧遵从(compliance)问题,被访者可能自行用网络搜寻答案并填答,导致研究者高估其认知能力和记忆能力。问题难度较大或被访者对问卷较感兴趣时,此现象更可能发生(Gummer&Kunz,2022)。因此,自填网络问卷中知识类问题的效度将低于面访问卷。
四、问卷调查方法质量提升路径二:调查方案设计的维度
在完成科学的问卷设计后,如何形成规范、科学、高效的调查方案则是事关问卷调查设计质量的另一个实践维度。
(一)复杂情境挑战与抽样设计突破创新
面对问卷调查中经验教训的积累,以及复杂性社会科学兴起背景下的复杂调查情境挑战,调查方案设计技术不断优化,突出表现为抽样设计的创新。抽样的基础是有一个完整的、每个抽样单元被抽中概率相同的样本框,且样本框总体应尽可能避免对目标总体的覆盖不足或过度覆盖。居住清单是构建抽样框的重要基础。官方提供的居住清单可能并不包括所有的住房单元,从而造成抽样框不完整,而比较-增强列表、检查遗漏的住房单元和增强地址覆盖率三种方法有助于解决这一问题(Harter&English,2018)。在抽样环节,研究者也针对研究群体的不同特点,提出了有针对性的抽样方法,如用三阶段整群抽样法对来自移民群体的住家家政工人进行抽样(Chungetal.,2020),用地理方法和现场招募相结合的GPSIS方法(成地理比例的街道拦截抽样方法)获取夜生活参与者的样本(Labhartetal.,2017)。
随着研究群体与研究议题的拓展,为尽可能接触研究对象,传统的“确定目标总体—构建样本框—抽取样本”过程也被打破。被访者驱动抽样(respondent-drivensampling)可以更好地接触规模较小且一般不愿暴露身份的“隐藏人口”,且能对总体特征做合理推论(赵延东、Pedersen,2007)。近年来,也有研究阐释了运用该方法调查身份敏感群体的可行方案(Michaelsetal.,2019)。此外,在招募性别少数青年(thegenderminorityyouth)开展调查等情况下,还可强化社交媒体等的运用(Salketal.,2020)。这些研究都对后续同主题或类似群体调查的抽样设计具有方法论意义。
(二)信息化时代红利与调查工具的拓展运用
但是依托不断发展的调查工具来丰富调查方案也面临持续挑战。第一,所选工具有效性仍需不断检验。例如,研究发现虽然移动手机可用于追踪研究,但运用其追踪调查流动性较强的群体也许并不能达到预期效果(Keuschetal.,2021)。第二,一系列伴生问题也加剧了调查方案选择的不确定性。不同问卷工具及发放、填答方式均显著影响应答质量(Bowling,2005),这加大了工具选择的复杂程度。网络调查中,虚假数据、涵盖误差等问题也会因“刷单”行为而不断凸显(邵国松、谢珺,2021),从而可能削弱调查对象的代表性、可及性。在信息安全建设尚需完善的情况下,基于网络的问卷调查和信息存储、信息转移可能加剧信息泄露风险,不利于个体隐私保护。
综上,提升问卷调查方法质量有多条路径,具体如表3所示。
五、延展性讨论
基于上文对国内外问卷调查设计质量提升路径的梳理、评价与反思,本文提炼出进一步提升质量可遵循的若干原则,并对全文加以延展性讨论。
(一)提升问卷调查设计质量的原则
对问卷调查设计科学性的研究永无止境。问卷调查的规范化和标准化程度直接影响调查结果的准确性(董海军、李希雨,2021)。在质量追求的实践中,问卷工具使用不断标准化、规范化,测量指标建构不断优化,问题设计与调查工具选择更为合理,为评估和调整问卷信度与效度提供了更扎实的方法论基础,也提升了问卷调查的可操作性、可复制性,保障了基于问卷调查所收集信息的信度与效度。问卷调查设计的优化还应遵循以下几个原则。
一是聚焦研究对象关怀性原则。更好地将研究对象纳入研究的重要性不亚于坚持方法的规范性。通过对近年来问卷调查设计质量提升路径的分析,可以发现问卷调查在追求科学性的同时,亦在不断提升对社会事实的“穿透力”。理解社会中的行动者是社会科学的重要价值所在,问卷设计中进一步引入定性研究的思维与方法,能使问卷更好地反映群体真实观念与区域社会文化特征,成为彰显社会科学对人类社会关怀的有效工具。
二是注重访者和被访者自主性原则。问卷调查设计也在逐步打破较为简单机械的“刺激-反应”,研究者不应拘泥于科学理论的指引,需更积极主动地拓展被访者自主表达的空间,允许其对问卷设计施加更多影响。促进访者和被访者在问卷设计的“合作”中进行更为充分、平等的交流,激发彼此自主性,有助于提高问卷调查发现新现象、生产新知识的可能性,提升科学主义范式遭受冲击下问卷调查的合法性。
四是调查(研究)成本与成效平衡原则。其一,更科学地控制调查规模。促进科学抽样技术进一步发展,在控制样本容量的同时更好保证代表性,降低调查成本。其二,通过多种调查工具的发展与组合运用,以及问题设计创新,持续克服问卷调查中无应答问题。其三,提前解决可预见问题。研究设计是解决潜在问题的“黄金时期”。例如,样本选择性偏差一旦发生,消除或校正就十分困难,因此在研究设计阶段就需做出评估并做出相应处理。改善问卷调查设计,需进一步提高发现和处理此类问题的能力,以提升研究效率。
(二)提升问卷调查设计质量的着眼点
基于上述原则,笔者认为未来质量提升应着眼于以下方面。
最后,强化多主体合作,使调查方案设计更好适应复杂社会情境的挑战。随着调查条件的改变与研究问题的深入,一些高质量问卷调查已不再是单一研究者(团队)甚至是社会科学学者群体所能完成的,需要多主体间的深度合作。其一,需要加强构建学术共同体,在全国性、连续性学术调查项目之外,强化小型调查项目间调查资源、工具、技术共享,提升数据间兼容性。其二,强化与信息工程等领域专业人员的合作,提升基于信息技术的调查工具研发科学性与有效性,使社会科学研究者调查诉求得以高品质“变现”,为保障调查对象代表性与可及性、调查方案适用性等提供工具支持。其三,强化与政府、行业部门合作,在收集国家治理、特定行业数据时,克服数据获取的局限性,提升调查实施主体的合适性,为数据质量评估提供更多条件。
(三)讨论与结论
问卷调查方法难以言说过时与否,其运用与创新将继续贡献于社会科学知识生产。梳理反思方法的发展,是贡献方法方面知识增量的重要途径。本文围绕问卷调查设计质量展开系统总结与反思,主要贡献如下。
其次,更好履行对被研究者、资助方、公众的责任。“问卷的历史也是一部心理操控术以及推销术(即一系列寻找打开大众心扉的魔力词语的尝试)的历史。”(坎德雷,2018:7)不断改进测量以深入被访者心理区域的过程中,应坚持保障被访者的自愿参与和知情权。可通过数据变换、添加噪声、补植等方法规避敏感性数据披露中出现较高“泄露风险”(riskofdisclosure),避免“泄露导致伤害”(harmfromdisclosure)(格罗夫斯等,2017:315-318)。相较对问卷调查“最佳实践”的不懈追求,对实践过程的坦诚披露可能更重要。如因设计问题造成数据扭曲,出现观察或非观察误差,研究者均应向资助方和公众透明呈现,以最大限度减小对后续研究与实践的负面影响。
总之,一种研究方法要持续对社会科学知识生产作出重要贡献,就必须在经济社会发展与研究内容不断延伸的过程中保持生命力,在与不同研究方法的竞争中保持竞争力。因此,问卷调查方法的质量追求是一项无止境的事业,需不断实践、反思与突破,亟待研究者深入挖掘。我们也期待本主题能涌现更多高质量成果,促使问卷调查作为描述、解释、预测社会现象的重要工具,为社会科学研究与社会实践提供更有力的方法指引。