回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?

SPSS教程44单、多因素回归结果结果矛盾的处理方法

这一篇接着介绍先单后多的统计建模方法。

先单后多,最令人沮丧的,莫过于单因素P<0.05,而多因素大多数没有统计学意义,甚至一个都没有。这可怎么办!!怎么回事!!不仅如此,有些时候单因素>0.05,多因素可以出现统计学差异的惊喜局面哦。

单因素、多因素结果矛盾原因

这种情况的原因是什么?大概原因包括:

(1)多因素回归自变量个数太多,样本量不够,建模失败

(2)存在着混杂变量

(3)存在着中介变量

(4)存在着交互效应

(5)排除中介变量后,存在着其它多重共线性

主要的原因是存在着混杂变量和中介变量。

单因素、多因素结果矛盾如何处理

如何处理?

当然,最重要的是,在多因素回归分析之前,厘清好各变量的因果关系。对!借助DAG的方法能够形成相应的因果网络。

但是,DAG构建并不是那么容易,更多的时候,我们需要借助统计方法,来绘制DAG的连接线。

我推荐的方法是,“两因素建模法”和“去因素建模法”来探索自变量为什么先单后多结果不一致。

两种方法原理相似,他们的关系如同逐步回归法中的“向前逐步”和“向后逐步”方法。也非常容易理解。

两因素建模法

”案例分析

例1:Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿,考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。)

首先是单因素回归分析的结果:

在所有结果中,随访次数,没有统计学意义,因此多因素排除在外,剩下的全部纳入多因素回归分析(P<0.2)。结果如下:

结果发现,单因素分析中,种族是没有统计学差异,多因素P<0.05!早产次数,应激性单因素有统计学意义,多因素P>0.05!此外,吸烟、高血压的效应值(exp(B)即OR值)都在增大,这是为何?

我现在采用“两因素”分析法,一探究竟!

1.为什么种族单因素没有统计学差异,而多因素有?

我建立多个回归模型,每个回归模型因变量是“低出生体重”,自变量是“种族”和一个其他自变量,因此称为2因素回归分析。

然后,我发现,种族+吸烟的两因素回归模型结果诡异!

吸烟在场,种族的效应具有统计学意义了!

什么原因?因为吸烟对种族而言,是一个中介变量!这个中介变量。这个示意图的效果如下:

种族总的效应是2.3,通过吸烟的是-0.7,而不通过吸烟的是3.0,因此,当两因素在的时候,通过吸烟的作用被阻拦,则效应值则变成了3.0,更为他突出了。

2.为什么高血压的效应值大大增加了呢?

我同样利用两因素法建立多个回归模型,每个回归模型因变量是“低出生体重”,自变量是“种族”和一个其他自变量

结果发现,孕妇体重影响甚大:

单因素高血压OR=3.365,两因素变为5.998!

那么产妇体重是什么变量?在这里显然,不是中介变量了,而是混杂变量。

去因素建模法的应用

我针对早产次数“单因素有统计学意义,多因素P>0.05”的矛盾进行分析吧

我先采用两因素进行分析,探讨影响早产次数的干扰因素。你们觉得谁影响了早产次数呢?答案是应激性和吸烟!

现在采用“去因素法”建模。“去因素法”指的是,在全因子模型中,剔除被怀疑的因素,在本例,需要剔除应激性与吸烟!

可以看出,应激性和吸烟同时在场,则早产次数没有统计学意义,而应激性和吸烟不在场,早产次数则有统计学意义了,和单因素分析结果一致!

那么应激性与吸烟是中介变量还是混杂呢?先思考下!文末有答案。

小结

第一,两因素法和去因素法是一种探索性的方法,可以帮助诸位粗略地发现结果异常严重的现象,特别是关键变量单因素、多因素的矛盾。不妨结合两种策略来试试!

第二,两因素法和去因素法主要窥探中介与混杂的影响,但是究竟属于中介还是混杂,需要根据理论知识来判定。

第四,对于能考虑中介与混杂变量的场景,两因素法和去因素法可能收效甚微!

第五,对于单因素和多因素回归分析结果矛盾时,千万不要觉得沮丧。这反而是你们大展身手的时候!想办法去解释矛盾之处,是一篇论文的亮点!

第六,从理论上分析,应激性与吸烟应该是中介变量!

--本文毕--

系列撰写者:郑卫军,浙江中医药大学医学统计学教研室主任。

THE END
1.求助单因素分析有意义,多因素分析无意义,如何分析2.做多因素分析前,首先做单因素分析,然后将单因素分析有统计学意义的因素进行多因素分析;3.如果多因素分析结果没有意义,在排除了共线性外,就是指标间本身可能没有关系,或者数据质量欠佳或者样本量不足。 2010-05-03· IP青海 回复 haippin 肝病科医师 3 个人认为楼上的“做多因素分析前,首先做单因素分析,https://3g.dxy.cn/bbs/topic/17092930
2.单因素分析有意义,二元logistic多因素分析时,无意义的因素还要单因素分析有意义,二元logistic多因素分析时,无意义的因素还要考虑进去吗? 人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。 经管之家是国内活跃的在线教育咨询平台! https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_3015685_1.html
3.医微客来源:“小白学统计”微信公众号;作者:冯国双。 很多人在做多因素分析的时候,往往都按这种方式:首先把所有因素挨个做个单因素分析,然后单因素分析有意义的变量,再放到多因素分析中,最后得到一个多因素分析模型。然后完事,发表文章。当然,在单因素分析的那一步,有http://ewitkey.cn/cms/show-259.html
4.单因素分析与多因素分析的结果矛盾怎么办?对于情形C,在单因素分析中差异无统计学意义,但多因素中差异却有统计学意义。这种情况并不常见,原因是当我们进行单因素分析差异没有统计学意义时,一般不会再将此自变量引入多因素分析。事实上,混杂因素使自变量与因变量的关联扭曲了,这里的扭曲可以是关联增强,也可以是关联减弱甚至掩盖了真实的关联。因此这种情形C就会https://www.lcgdbzz.org/en/custom/news/id/10255
5.“先做单因素,有意义的做多因素”——这种思路对吗?(上)@MedSci很多人在做多因素分析的时候,往往都按这种方式:首先把所有因素挨个做个单因素分析,然后单因素分析有意义的变量,再放到多因素分析中,最后得到一个多因素分析模型。然后完事,发表文章。当然,在单因素分析的那一步,有的人用0.05作为水准,P小于0.05的变量纳入多因素,有的则以0.1或0.15、0.2等为水准,P小于0.1或0.15、https://m.medsci.cn/article/show_article.do?id=9f3c135e22d8
6.“先做单因素,有意义的做多因素”——要不要这种思路?.docx“先做单因素,有意义的做多因素”——要不要这种思路?.docx,“先做单因素,有意义的做多因素”——要不要这种思路? 2018-04-16 上一篇文章通过一个例子说明,不少人经常用到“先做单因素分析,然后把单因素分析中有统计学意义的变量纳入多因素分析”这种思路在有些情况下https://max.book118.com/html/2021/0727/5312301201003320.shtm
7.为什么我做单因素的时候显示有些统计结果有统计学意义,但是多因素为什么我做单因素的时候显示有些统计结果有统计学意义,但是多因素的时候就显示无意义,但是总的(多个分类的)显示有意义。 (来自医咖会用户的既往提问,小咖整理)全部评论(1) 医咖会管理员 可能是某个因素在考虑其它因素的情况下就没有意义了,最大的可能就是各个因素之间相关性比较大,变量之间存在共线性,建议剔除几个https://www.mediecogroup.com/qa/questions/428/