t检验大概是流传最广泛、应用最多的一种统计方法了,不管是在统计学界还是临床中,t检验几乎无人不知无人不晓。而与此相对应的是,t检验大概也是应用错误最多的方法之一了。
据本人多年审稿经验,直至今日,t检验应用依然错误百出,有时确实令人纳闷。因为其实这些都是完全可以避免的,可为什么还存在这么多误用呢?我想,统计学的正确推广应用还是路漫漫而任重。
本文结合审稿中的一些现象,说明t检验应用中常见的一些错误,旨在为临床医生提个醒,尽量避免一些可有可无的错误。
从笔者审稿情况来看,t检验应用常见的问题主要有以下几种:
(1)不考虑数据的正态性,只要是两组比较就直接用t检验。
(2)将t检验用于多组的两两比较,增加假阳性错误。
(3)不考虑资料是否独立,采用独立资料的t检验分析非独立数据。
下面通过3个例子来说明这几个问题。
例1:某研究探讨血清肿瘤标记物在肺癌诊断中的意义,对肺癌组与肺良性病变组、健康体检组血清肿瘤标记物CEA、CA199的水平进行比较(表1)。该研究采用t检验分别对其中的任意两组进行比较。
表1 肺癌组与肺良性病变组、健康体检组血清肿瘤标记物CEA和CA199
组别 | 例数 | CEA | CA199 |
肺癌组 | 173 | 51.32±8.31a | 23.11±2.50a |
肺癌 | 28 | 17.99±5.05 | 30.44±10.28 |
鳞癌 | 100 | 69.45±13.57b | 24.59±2.94 |
小细胞癌 | 45 | 31.70±7.91b | 18.05±4.21 |
肺良性病变组 | 99 | 5.10±8.31d | 13.11±1.17d |
健康体检组 | 42 | 3.01±0.27 | 10.37±0.81 |
注:与肺良性病变组比较,aP<0.05,与鳞癌组比较;bP<0.05,与小细胞癌比较;cP<0.05,与健康体检组比较,dP>0.05。(此处为作者原文标注)
案例分析:本研究为三组定量资料的比较,且肺癌组还包含三个亚组。研究者直接采用t检验分别对其中任意两组进行比较,这种做法的直接后果就是增加假阳性错误,可能导致本来没有统计学意义的结果变得有统计学意义,从而产生虚假结论。
建议:该研究为多组独立资料的比较,如果数据服从正态分布且方差齐,建议选用方差分析进行多组间比较,如果多组间差异有统计学意义,再进一步采用两两比较的专用方法进行多重比较(两两比较方法的选择将另文详述)。
专门针对医生的建议:不知道两两比较该怎么做,最好找统计学家。
例2:为了研究内皮素(ET)与先心病室缺伴肺高压的关系,选择无肺高压的先心病室缺患者为对照组;另选先心病室缺且患有重度肺高压的患者为观察组。于术前24h、术后24 h及72 h测定血浆中ET含量。作者在方法学部分提到“所有数据用t检验处理”。
表2 手术前后血浆中ET浓度的变化
分组 | 术前24小时 | 术后24小时 | 术后72小时 |
对照组 | 54.82±14.62 | 53.14±9.32 | 51.65±14.87 |
观察组 | 75.50±14.62* | 62.56±15.27*# | 65.65±16.51*# |
注:* 与对照组比较P<0 05;#与术前24 h比较P<0.05
案例分析:该资料很具有代表性,很多临床研究都是如此,分几组,然后在不同时间点观察疗效。此类资料尽管是两组,但两组的资料是3次重复测量的数据,术前24小时、术后24小时和术后72小时三个时间点的测量值之间可能具有一定的相关性,即非独立数据,这一资料实际上是两组重复测量资料。由于数据非独立,因此不宜采用独立样本的t检验,否则容易增加假阳性。
对于此类资料,很多临床医生习惯做法是:对每个时间点,分别进行t检验,然后对每个时间点分别说明有无差异等。这种做法并不是很合理,现在很多杂志已经要求此类资料应该选择用重复测量方差分析了。
建议:选用重复测量方差分析,同时分析资料的组间差异和时间点差异,还可分析组别与时间点的交互效应,探索随时间的变化趋势等。
专门针对医生的建议:此类资料,直接找统计学家分析,别自己浪费时间了。
例3:某研究探讨护理干预对肺癌患者癌性疲乏和生活质量的影响,通过比较护理干预前后各指标值的变化,分析护理干预的作用。文章对所有定量指标全部采用配对t检验进行比较。这里列出恶心呕吐这一指标作为示例(表3)。
表3 护理干预前后指标值的变化
指标 | 干预前 | 干预后 |
恶心呕吐 | 11.79±17.01 | 10.16±12.57 |
案例分析:从表3结果来看,该指标的标准差大于均值,数据很可能是偏态的(当然并不是一定,但起码值得怀疑),而文章并未报道数据的分布情况,尤其是没有说明前后差值是否满足正态性,而直接采用配对t检验,忽略了配对t检验应用的前提条件。
建议:首先应对该指标进行正态性检验,如果前后差值服从正态分布,可以采用配对t检验,否则应考虑采用Wilcoxon配对秩检验。
专门针对医生的建议:此类资料比较简单,可以自己做。如果对非正态数据不知道如何处理,找统计学家帮忙。