听一个理科女博士讲讲她的毕业论文——你有勇气听吗?

今儿以前的大学同学转载了个文章,是UCLA的一个应用语言学的博士(呃,好像里面也没提到是男博士还是女博士,但字里行间感觉是女博士)写的在美国顶尖大学读文科博士拼的到底是什么。文章发布在PETD亚洲善待博士组织公众号(呃,总觉得这个名称有点奇异,也许,有个善待组织,言外之意是很多博士都在被虐待吧。公众号介绍说,这里是全球善待华人博士之家……艾玛,越发觉得奇异)。我同学说,文章写得不错但没必要总强调自己排名第一。确实,作者写了好多读博士的过程如何艰苦,比如,每天就睡一两个小时,然后字里行间若无其事地提到自己一个小时能阅读400-1000页英文书籍,全A的成绩,自己的博士论文如何前无古人后无来者。可是,就学理科的人看来,一小时读400-1000页的英文书籍,那得看他读的是什么书,以及书籍如何排版,页面大小,然后读完了之后理解了多少。以前跟一个数学系的博士聊,她说有时一个一页半的证明能讨论一礼拜。所以,追求阅读速度也分学科。有点不客气地说,一小时读400页,这400页中的干货能有多少,着实是个可疑的问题。

好,言归正传。读了那篇文后恍然发现,作者说了好多外围的事儿,但是对于自己真正研究的东西只字未提,也许是认为读者们都是外行,跟外行谈论他的博士论文是是对牛弹琴,夏虫语冰。可是,语言学其实比很多学科平易近人多了,绝大部分人都至少掌握一门语言,哪怕没学过语言学,也一直在用语言,不像一些理工科,一些术语普通大众连听都没听过。

那么我今天就用通俗的语言讲讲自己博士论文所做的研究——也许读者中有人感兴趣,也许能激励一些人去做研究,也许能给其他领域的一些人灵感。这个,比空洞地谈论博士期间上了哪些课,如何通过资格考试的笔试和口试,以及如何最后答辩,要好玩儿多了。

我的博士论文属于药物安全性研究。一片药拿在手里,我们如何知道它是否安全呢?患者A把它吃了,过一会儿药劲儿上来了,头痛欲裂……这个药安全不安全呢?另一个药,患者B吃了一礼拜,发生了胃肠道大出血,差点丧命……这个药安全不安全呢?还有一个药,癌症患者C吃了,起了一身的疹子,这个药安全不安全呢?……

所以一个药物要想在市面上呆着,除了有效,还要安全。是药就有安全性问题。

但是药物作用于人体,是一个非常复杂的过程。人跟人又不一样,一个药,可能这个患者吃了没啥事,那个患者吃了就生不如死,所以,单看一个病例,比如上面的不良反应,来判断药物的安全性,是不行的。有些人特别爱道听途说,听说某某吃了某种药以后肝功能衰竭了,刚巧自个儿也在吃这个药,就特别害怕,有的甚至自作主张就把药给停了,还骂给他开处方的大夫是庸医。而且现实世界还有一个很大的迷惑性,就是很多时候因为存在时间的先后顺序,人们就误以为其中存在因果关系,但其实并没有。比如一个人早晨吃了药中午拉肚子了,他就以为是药弄的,其实是他早晨吃的那个包子馅儿坏了,根本不关药的事儿。还有,药物安全性没有绝对的,跟它治疗的疾病的严重程度有关。比如,治个感冒,如果吃的药能增加肾功能衰竭的风险,那这个风险就太大了。但是如果是治疗性命攸关的疾病,比如癌症,冒点风险就值得,不良反应再大,但是能救命啊,不能不吃。所以综上三条,我们评价安全性,要在有一定规模的人群中;要有对照组;要结合临床。在人群中,就可以知道,这个不良反应的发生率是20%,还是0.2%;有对照组,就能看出某种风险是升高了还是降低了,比如,头痛在没吃药的一组发生率是5%,在吃药的一组是10%,你就看出,这吃药的这一组的头痛的风险确实比没吃药的那一组高了;结合临床,就是要看这个药物使用的上下文,具体问题具体分析。结合临床还有一个意义,就是有的时候,风险是升高了,但是临床上没什么意义,比如,血栓在不服用避孕药的妇女中的发生率是万分之三,避孕药可以使这个风险升高一倍,达到万分之六,统计学有显著意义,但是临床上呢?虽然升高了一倍,但万分之六相当于一千个人里头还不到一个人会发生血栓,所以绝对风险是相当低了,跟意外怀孕比起来,这个风险是可以承受的。

所以我的博士论文研究,是研究中枢神经系统兴奋剂(stimulants),抗抑郁药(主要是SSRIs)以及抗精神病药(主要是非典型抗精神病药)在患有癫痫的儿童中的安全性。癫痫是美国儿童最常见的神经系统疾病的。患有癫痫的孩子常常伴发有精神上的问题,比如,注意力缺陷/多动症,焦虑,抑郁,或是行为问题,需要中枢神经系统兴奋剂,抗抑郁药和抗精神病药来治疗。但是这些药物有个风险,就是有可能导致患者癫痫控制的恶化,比如,以前好好的,吃了利他林(一种中枢神经系统兴奋剂)治疗多动症之后,发生了两次癫痫大发作,被送去了急诊。这个安全性问题是神经科医生和精神科医生都非常关心的。文献回顾显示这方面研究很少,绝大部分样本量小,随访时间短,也没有确定的结论。所以,我的任务就来在这个灰色区域画幅小画,填补个空白

前面说了,要有一定规模的人群做药物安全性研究。癫痫患儿就行,我就从Medicaid数据库里找了。凡是保险被Medicaid覆盖的孩子,得了癫痫,去看医生,医生会给个诊断的码(ICD-9-CM)为报销用。我就通过这些码按图索骥在很多个州的Medicaid的数据库中找到了大量病人。然后按照他们去药房的取药记录给他们分组,没吃药的一组,吃了药的一组,从吃药那天开始观察(没吃药的一组给指定个观察的开始时间,放心,不是瞎指定的,是保证了患者的癫痫诊断和开始用药之间的间隔在吃药组和没吃药组分布类似的),直到发现他们去看急诊了,或是住院了,就停止随访,给他们记上一笔。癫痫作为第一诊断的急诊或住院事件,是这个研究的主要终点。因为这些数据都是过去已经存在了的(1999-2010),所以称为回顾性队列研究。

有的时候患者因为种种原因不再被Medicaid覆盖,比如,家里父母又有工作了,收入超过了Medicaid允许的最低线,数据库里就没他们了,或者到了19岁的生日,不再是儿童了,等等一系列原因,我也停止观察并截断了这些数据,因为之后的事情不再知道,或者患者已经超出了我们的研究范围。

论文的统计方法采用生存分析,用的是最常见的Cox比例风险模型。Cox模型在药物流行病学领域特别火,很多文章都用。它的优点,简要说来就是因为采取了指数操作,所以无论怎么折腾都不会有荒唐的看一眼就知道错了的结果,比如,生存概率是负的。Cox模型最终会给出一个风险比(HRHazardRatio)。风险比都是拿吃药组和没吃药组比的。如果HR大于1,说明风险升高,HR小于1,说明风险降低(还要结合置信区间来看)。

除了主要的分析以外,还做了一些看起来比较“花式”的研究,主要就是检测了这些药物暴露和患者自身特点的相互作用,比如,脑瘫患者服用中枢神经系统兴奋剂会不会特别危险?还有这些药物之间的相互作用。相互作用的含义是这样,比如,中枢神经系统兴奋剂和不用药相比,在脑瘫患者中发生癫痫作为第一诊断的急诊的风险比是2.0,在不是脑瘫的患者中的风险比是1.2,那么脑瘫实际上对中枢神经系统兴奋剂的风险有影响,换言之,二者就存在着相互作用。

在比较的过程当中,也就是求这个风险比的过程中,需要控制很多混杂因素,因为用药组和没用药组在很多方面存在区别,我们要保证不是这些区别导致了风险比升高,所以这些区别必须在模型中矫正,包括年龄,性别,种族,居住地,合并症,联合用药等等总共四十多个变量。控制混杂是药物流行病学永恒的话题。但遗憾的是,观察性研究总不能完全去除混杂,这个对于有洁癖的人,有强迫症的人,是一种折磨。

以上是论文最主要的部分。除此之外,还包括了对癫痫患儿的抗癫痫药物以及所有精神类药物使用的描述性研究,各个州之间的差异,以及时间趋势。

说到这你可能想知道研究的结果了。到底中枢兴奋剂安全不安全呀?抗抑郁药安全吗?抗精神病药安全吗?检测到相互作用了吗?大概说说吧,中枢兴奋剂基本上是安全的(论文里可不敢这么写,只能说未能发现升高的风险),抗抑郁药,特别是SSRI,以前人们以为很安全,但是我却发现风险还是升高了大概20%,抗精神病药提高风险10%。药物之间的相互作用没什么发现,可能跟样本量不够大有关,然后SSRI在局部性发作的患者中可能住院风险要升高70%

论文做完了,毕业典礼也参加过了,博士帽也戴上了,那么,我上面发现的这些数据,升高的这些10%20%,乃至70%的风险,到底是真的吗?大自然真的存在这些风险比吗?有没有可能我们想去寻找一只正确的猫,但是却只找到了白猫,黑猫,还有花猫,而那一只正确的猫根本就不存在呢?

所以,毕业过后,导师建议我读读,波普尔的著作。