上次课解读了新英格兰研究的摘要,本次课解读图表结果。
手把手教你用易侕软件的4个模块,8分钟内做出NEJM的统计图表。
简要回顾摘要,2016年发的新英格兰(SCI影响因子74分)
题目:sFlt-1:PlGF对于孕妇先兆子痫的预测值
设计:观察性研究
对象:1050例单胎妊娠孕妇
指标:检查sFlt-1:PlGF的值,观察是否发生子痫前期
结果:sFlt-1:PlGF≤38,1周内不发生子痫前期。阴性预测值99.3%,敏感性80%,特异性78.3%
结论:对于临床上的高危人群,sFlt-1:PlGF如果≤38,可以预测1周内不发生子痫前期
图1是研究对象入选流程图,就不专门讲了。只强调两句话:1、不要随机选择研究对象;2、有随访缺失的人很正常,研究对象入选流程图里写清楚就行:排除了多少例随访缺失的,如上图排除了52werelosttofollow-up,新英格兰都有随访缺失,你怕什么。
图2是在建模和验证队列中,展示用指标(sFlt-1:PlGF)=38区分是否有疾病的结果。
箱图中间的横线表示这组中位数,上下框是上下四分位数,外面的点是离群值。可以看出,患者的测量值比较高。用38这个值可以较好的区别大部分的患者与非患者。这个图是定性的看看,发现38作为诊断界值还不错,下面进一步分析得出量化结果。
【吸取经验】做诊断试验的SCI论文,最好也搞这样一个图,一目了然,告诉审稿人你的指标区分患者与非患者,有多好!
结果如何解读呢?以红框的结果举例:在验证队列中,阴性预测值99.3%,表明如果X≤38,一周内不发生子痫前期的正确率为99.3%,是指测出的全部阴性例数中,真正没有患本病的例数所占的比例为99.3%,这就很高了。括号里面的是95%可信区间,表明波动范围在97.9-99.9。下面是敏感性80%,特异性78.3%。
为什么不是37或者39呢?这个界值是怎么确定的呢?下面图3回答这个问题。
图3是诊断试验ROC分析的图,可以看到两条线,一个是建模队列,一个是验证队列。图中标记的是诊断界值38。这个点基本是最靠近左上角的顶点了。使得敏感度和特异度综合起来最高。取了整数便于临床应用。如果你做诊断试验,这个图是一定要做的。
本研究诊断的是妊娠期高血压疾病的风险,如果把患者血压值考虑进来进行诊断,是否会使得诊断价值更高呢?作者在附图中进行了分析:
附图给出了X和临床指标联合做诊断试验ROC分析,临床指标包括:收缩压、舒张压、尿蛋白。
【吸取经验】如果你做诊断试验的SCI论文,最好也搞这样一个图:单指标和多指标联合并进行比较。
把原始数据整理到一张表中,每个研究对象一行,全数字编码,例如ID编号=1的研究对象,金标准诊断结果是没有子痫前期,测量值是12。后面是其他变量。数据整理好后,进行统计分析。
工欲善其事,必先利其器”,工具很重要。第一步,在官网免费下载安装易侕软件。后台是R语言程序,获得国际认可,已有多篇SCI论文发表。
首先,在桌面上新建一个文件夹,命名为DATA。这样后续的分析结果,就存在本文件夹中。
第二步,把数据和变量说明文件放在文件夹内。数据可以在本课程的“资源下载”中获取。把上述两个excel文件分别“另存为”-“文本文件(制表符分隔)”
打开易侕软件,左上角分析项目-创建新项目。
点“浏览”找到文件夹“DATA”里的“DATAsflt.txt”,点“读取数据文件”
数据成功导入,每个变量的基本统计描述就自动得出了。
点击数据操作-读入变量编码与注解文件,变量就注解好了。
如果投英文的期刊,就注解成英文的;如果投中文期刊,就注解成中文的。
下面看使用易侕软件4个模块5分钟内轻松实现论文中的图表。
结局变量Y:Preeclampsia(子痫前期)
评价指标X:sFlt-1PlGFratio(某检测指标)
其他因素Z:AGE(年龄)、wkofgestation(孕周)、BMIbeforepregnancy(孕前BMI)、Systolicbloodpressure(收缩压)、Diastolicbloodpressure(舒张压)
4个模块操作
用“数据分析”的“研究人群描述”模块
用“数据分析”的“变量图示与统计检验”模块
用“数据分析”的“诊断试验与预测方程”-“诊断试验与RCO分析”模块
用“数据分析”的“诊断试验与预测方程”-“预测模型与RCO分析”模块
表一“研究人群描述”,看用易侕如何实现。
选“数据分析”的“研究人群描述”模块。把要分析的变量拖入“分析变量”;把Y拖入“选择列分层变量”,点击“查看结果”。
看这个结果截图,表一就这样做成了!得出连续变量的均数、标准差;分类变量得出例数百分比。本例数据只是为了方便大家练习做的模拟数据,所以具体的数字结果跟原文结果对不上。
慢!还有问题:原文中有两个大组(建模组和验证组)怎么做啊?别急,这个后面讲模型构建的时候会讲。
下面看使用易侕“变量图示与统计检验”模块,轻松实现论文中的箱图。把相应变量拖入输入框内,如图所示,点击“查看结果”。
直接输出论文中需要用到的箱图和所用统计指标结果。
下面看使用易侕“诊断试验与RCO分析”模块。先做个简单的,把X和Y拖入输入框内,如图所示,点击“查看结果”。
直接输出论文中需要用到的ROC曲线,以及所有统计指标结果都有了。图有png格式和pdf格式的矢量图,像素完全能满足高质量SCI期刊的发表要求。各分界点对应的敏感度特异保存在ROC输出文件(.xls)里也都有了。
这里的ROC曲线是一条线,如何把多条线画在一幅图里面呢?需要首先构建联合诊断的方程,操作如下:
继续用这模块,把多个变量联合诊断加上:分析方法选择“2:所有X(预测模型)分析”,并且在下面框中拖入多个指标用于联合诊断,这里选择指标sFlt-1:PlGF、收缩压和舒张压举例。点击“查看结果”。
复制这里得出的方程,用于计算联合指标的新变量Xn1=-2.33602+0.09980*X+0.00459*X4-0.02158*X5。
同样的操作,选多个指标用于联合诊断,这里选择收缩压和舒张压。点击“查看结果”。
复制这里得出的方程,用于计算联合指标的新变量Xn2=0.23077+0.00705*X4-0.01583*X5
最后,把单个指标、联合3个指标的变量Xn1和联合两个指标的变量Xn2,都放在选框中,分析方法选择“1:逐个X(检测项目)分析”。
下面看使用易侕“预测模型与RCO分析”模块。这里可以设置构建模型所用样本。可以随机按比例把所有观察样本分成建模组developmentset(Dset)与验证组validationset(Vset)。这里设置比例为50%建模50%验证。
可以得出一个Excel数据文件,里面的splitGROUP变量就是分组变量。下一步在“数据操作”菜单下选“更新源数据文件”。重新运行一般人群描述模块,把splitGROUP变增加到“选择行分层变量”中,就得出了建模和验证的结果。其他图表也可以通过增加分层变量实现,这里就不再演示了。
到此为止,我们就把这篇新英格兰临床研究的所有核心图表结果做出来了,操作起来并不是那么难吧?不需要自己选择统计分析方法,不需要学R语言编程,临床医生自己就能做出这些分析了。
易侕后台是R语言,因此发表论文时,统计方法部分需要写用R语言做的分析。具体写法可以参考已经发表了SCI论文。
更多云课堂免费公开课简介
易侕精品课:
《接轨SCI临床科研设计与数据分析概述》
《获取免费公开数据资源方法》
《Level1:易侕软件基本操作课程》
《Level1:看懂临床型SCI论文核心结果》
【适合人群】本内容适合于希望学习临床型SCI数据分析的学友。