举几个例子,看看多因素分析中可能犯的错

【原文】将文化程度、月收入等19个因素进行单因素Logistic回归分析,筛选出12个有统计学意义的影响因素。将单因素分析筛选出的有意义的可能危险因素,进行多因素条件Logistic回归分析,最终进入模型的因素有6个,整个模型有统计学意义(似然比χ2=135.21,P<0.05)。(《中华疾病控制杂志》2010年发表)

【分析】作者只将单因素分析结果显示有统计学意义的变量纳入多因素分析是不正确的。因为这些变量与结局之间的关系可能受到混杂因素的干扰,单因素分析无法避免这种情况。

单因素分析没有统计学意义的自变量,不代表多因素分析时其也无统计学意义。在自变量较多的情况下,可以采用逐步回归分析方法。但应注意,变量是否显著及作用大小,与模型中包含的变量有关,如在模型中含有{X1},{X1,X2}或{X1,X2,X3},这三种情况下,X1的检验结果可能会有很大的不同。实际中最好结合专业背景和研究目的去选择变量[1]。

(详细阅读:那么多变量,我该选择哪些进入多因素分析呢?;前进法、后退法...N多人问过的自变量筛选方法,再来细讲下!)

二、单因素分析代替多因素分析

【原文】烧伤入我院治疗的132例患者中,有HCV感染者105例,占烧伤患者79.5%。对HCV感染者,我们进一步对年龄、有无输血及血制品、输血及血制品的量、烧伤程度等进行了对比分析(见表1、2、3)。

表1.不同年龄组输血及血制品与HCV感染

表2.输血及血制品不同用量与HCV感染

表3.不同烧伤程度与HCV感染

【分析】作者想研究“HCV感染与否”与年龄、有无输血及血制品、输血及血制品的量、烧伤程度之间的关系,在分析的过程中,作者仅采用了单因素的分析方法,分别对每一项研究因素与HCV感染之间的关系进行了列联表χ2检验,但这样做并不合适。在进行单因素分析时,忽略了其他因素可能的影响,以及研究因素之间的相互影响,当结果为P<0.05时,并不能说明就是该因素的作用。

该资料可以采用Logistic回归方法,以“HCV感染与否”作为因变量,年龄、有无输血及血制品等作为自变量进行分析,筛选有意义的变量,并且可以计算OR值来说明自变量对因变量的影响。

此外,该研究还存在其他问题。例如,年龄、烧伤程度都是有序分类资料,用列联表χ2检验是不正确的,应该使用秩和检验。

(更多阅读:SPSS实例教程:二分类Logistic回归;SPSS详细操作:碰见有序分类资料,怎么办?)

三、生存分析中的常见问题

【原文】UFTM与EAP方案是目前临床常用治疗胃癌方案,从1989年-1996年我们用这两种方案治疗晚期胃癌53例,现就临床对比疗效情况报告如下。治疗后生存情况:随访45例,占85%(45/53),见表4。(《陕西肿瘤医学》2000年发表)

表4.两组病人生存情况对比

②对于失访的8例患者并没有做出说明,而只是将数据删除不予考虑。

④当多个混杂因素存在时,也可以采用COX比例风险模型进行分析,从而得到校正混杂因素之后两种治疗方案的疗效情况。在该研究中,就可以采用COX比例风险模型进行多因素分析,来评估两种治疗方案的疗效。

(更多阅读:KM法生存分析,史上最详细的SPSS教程!;SPSS详细操作:生存资料的Cox回归分析)

参考文献:

[1]孙振球.《医学统计学(第3版)》

精彩回顾

1.统计分析数据时的几大常见错误,有中招的吗?

2.一言不合就用t检验,小心犯了这些错!3.论文统计图表常见的那些错,附大量实例!

THE END
1.求助单因素分析有意义,多因素分析无意义,如何分析2.做多因素分析前,首先做单因素分析,然后将单因素分析有统计学意义的因素进行多因素分析;3.如果多因素分析结果没有意义,在排除了共线性外,就是指标间本身可能没有关系,或者数据质量欠佳或者样本量不足。 2010-05-03· IP青海 回复 haippin 肝病科医师 3 个人认为楼上的“做多因素分析前,首先做单因素分析,https://3g.dxy.cn/bbs/topic/17092930
2.单因素分析有意义,二元logistic多因素分析时,无意义的因素还要单因素分析有意义,二元logistic多因素分析时,无意义的因素还要考虑进去吗? 人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。 经管之家是国内活跃的在线教育咨询平台! https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_3015685_1.html
3.医微客来源:“小白学统计”微信公众号;作者:冯国双。 很多人在做多因素分析的时候,往往都按这种方式:首先把所有因素挨个做个单因素分析,然后单因素分析有意义的变量,再放到多因素分析中,最后得到一个多因素分析模型。然后完事,发表文章。当然,在单因素分析的那一步,有http://ewitkey.cn/cms/show-259.html
4.单因素分析与多因素分析的结果矛盾怎么办?对于情形C,在单因素分析中差异无统计学意义,但多因素中差异却有统计学意义。这种情况并不常见,原因是当我们进行单因素分析差异没有统计学意义时,一般不会再将此自变量引入多因素分析。事实上,混杂因素使自变量与因变量的关联扭曲了,这里的扭曲可以是关联增强,也可以是关联减弱甚至掩盖了真实的关联。因此这种情形C就会https://www.lcgdbzz.org/en/custom/news/id/10255
5.“先做单因素,有意义的做多因素”——这种思路对吗?(上)@MedSci很多人在做多因素分析的时候,往往都按这种方式:首先把所有因素挨个做个单因素分析,然后单因素分析有意义的变量,再放到多因素分析中,最后得到一个多因素分析模型。然后完事,发表文章。当然,在单因素分析的那一步,有的人用0.05作为水准,P小于0.05的变量纳入多因素,有的则以0.1或0.15、0.2等为水准,P小于0.1或0.15、https://m.medsci.cn/article/show_article.do?id=9f3c135e22d8
6.“先做单因素,有意义的做多因素”——要不要这种思路?.docx“先做单因素,有意义的做多因素”——要不要这种思路?.docx,“先做单因素,有意义的做多因素”——要不要这种思路? 2018-04-16 上一篇文章通过一个例子说明,不少人经常用到“先做单因素分析,然后把单因素分析中有统计学意义的变量纳入多因素分析”这种思路在有些情况下https://max.book118.com/html/2021/0727/5312301201003320.shtm
7.为什么我做单因素的时候显示有些统计结果有统计学意义,但是多因素为什么我做单因素的时候显示有些统计结果有统计学意义,但是多因素的时候就显示无意义,但是总的(多个分类的)显示有意义。 (来自医咖会用户的既往提问,小咖整理)全部评论(1) 医咖会管理员 可能是某个因素在考虑其它因素的情况下就没有意义了,最大的可能就是各个因素之间相关性比较大,变量之间存在共线性,建议剔除几个https://www.mediecogroup.com/qa/questions/428/