t检验,你真的用对了吗?——论文发表中的一些问题

t检验大概是流传最广泛、应用最多的一种统计方法了,不管是在统计学界还是临床中,t检验几乎无人不知无人不晓。而与此相对应的是,t检验大概也是应用错误最多的方法之一了。

据本人多年审稿经验,直至今日,t检验应用依然错误百出,有时确实令人纳闷。因为其实这些都是完全可以避免的,可为什么还存在这么多误用呢?我想,统计学的正确推广应用还是路漫漫而任重。

本文结合审稿中的一些现象,说明t检验应用中常见的一些错误,旨在为临床医生提个醒,尽量避免一些可有可无的错误。

从笔者审稿情况来看,t检验应用常见的问题主要有以下几种:

1)不考虑数据的正态性,只要是两组比较就直接用t检验。

2)将t检验用于多组的两两比较,增加假阳性错误。

3)不考虑资料是否独立,采用独立资料的t检验分析非独立数据。

下面通过3个例子来说明这几个问题。

1:某研究探讨血清肿瘤标记物在肺癌诊断中的意义,对肺癌组与肺良性病变组、健康体检组血清肿瘤标记物CEACA199的水平进行比较(表1)。该研究采用t检验分别对其中的任意两组进行比较。

1 肺癌组与肺良性病变组、健康体检组血清肿瘤标记物CEACA199

组别

例数

CEA

CA199

肺癌组

173

51.32±8.31a

23.11±2.50a

肺癌

28

17.99±5.05

30.44±10.28

鳞癌

100

69.45±13.57b

24.59±2.94

小细胞癌

45

31.70±7.91b

18.05±4.21

肺良性病变组

99

5.10±8.31d

13.11±1.17d

健康体检组

42

3.01±0.27

10.37±0.81

注:与肺良性病变组比较,aP<0.05,与鳞癌组比较;bP<0.05,与小细胞癌比较;cP<0.05,与健康体检组比较,dP>0.05(此处为作者原文标注)

案例分析:本研究为三组定量资料的比较,且肺癌组还包含三个亚组。研究者直接采用t检验分别对其中任意两组进行比较,这种做法的直接后果就是增加假阳性错误,可能导致本来没有统计学意义的结果变得有统计学意义,从而产生虚假结论。

建议:该研究为多组独立资料的比较,如果数据服从正态分布且方差齐,建议选用方差分析进行多组间比较,如果多组间差异有统计学意义,再进一步采用两两比较的专用方法进行多重比较(两两比较方法的选择将另文详述)

专门针对医生的建议:不知道两两比较该怎么做,最好找统计学家。

2为了研究内皮素(ET)与先心病室缺伴肺高压的关系,选择无肺高压的先心病室缺患者为对照组;另选先心病室缺且患有重度肺高压的患者为观察组。于术前24h、术后24 h72 h测定血浆中ET含量。作者在方法学部分提到所有数据用t检验处理

2 手术前后血浆中ET浓度的变化

分组

术前24小时

术后24小时

术后72小时

对照组

54.82±14.62

53.14±9.32

51.65±14.87

观察组

75.50±14.62*

62.56±15.27*#

65.65±16.51*#

注:* 与对照组比较P<0 05#与术前24 h比较P<005

案例分析:该资料很具有代表性,很多临床研究都是如此,分几组,然后在不同时间点观察疗效。此类资料尽管是两组,但两组的资料是3次重复测量的数据,术前24小时、术后24小时和术后72小时三个时间点的测量值之间可能具有一定的相关性,即非独立数据,这一资料实际上是两组重复测量资料。由于数据非独立,因此不宜采用独立样本的t检验,否则容易增加假阳性。

对于此类资料,很多临床医生习惯做法是:对每个时间点,分别进行t检验,然后对每个时间点分别说明有无差异等。这种做法并不是很合理,现在很多杂志已经要求此类资料应该选择用重复测量方差分析了。

建议:选用重复测量方差分析,同时分析资料的组间差异和时间点差异,还可分析组别与时间点的交互效应,探索随时间的变化趋势等。

专门针对医生的建议:此类资料,直接找统计学家分析,别自己浪费时间了。

3:某研究探讨护理干预对肺癌患者癌性疲乏和生活质量的影响,通过比较护理干预前后各指标值的变化,分析护理干预的作用。文章对所有定量指标全部采用配对t检验进行比较。这里列出恶心呕吐这一指标作为示例(表3)。

3 护理干预前后指标值的变化

指标

干预前

干预后

恶心呕吐

11.79±17.01

10.16±12.57

案例分析:从表3结果来看,该指标的标准差大于均值,数据很可能是偏态的(当然并不是一定,但起码值得怀疑),而文章并未报道数据的分布情况,尤其是没有说明前后差值是否满足正态性,而直接采用配对t检验,忽略了配对t检验应用的前提条件。

建议:首先应对该指标进行正态性检验,如果前后差值服从正态分布,可以采用配对t检验,否则应考虑采用Wilcoxon配对秩检验。

专门针对医生的建议:此类资料比较简单,可以自己做。如果对非正态数据不知道如何处理,找统计学家帮忙。