无人引用的论文和咸鱼有什么区别

‍‍‍‍


发表了一篇新论文最期待什么事发生呢?当然是有人引用啦。


论文的被引用次数是评判一位科学家或一篇论文水平好坏的重要指标(但不唯一)。不管是毁誉参半的期刊影响因子,还是日渐兴起的科学家h-index,计算方法都是基于论文被引用次数。一篇高被引论文标志着它至少具备实用价值高、观点具有启发性、紧追热点等优点中的一条。当然,也有少数例外,大量“负面引用”起到的是反效果。


不要以为只有学渣研渣才担心论文的引用。已故诺贝尔奖获得者Oliver Smithies就曾自曝他1953年发表的一篇关于测量渗透压的论文[1] 从没有人引用过。但其实Smithies有点过于谦虚了,他的那篇论文在出版后的十年内被引用了9次。你觉得这个成绩很糟?那请往下看吧。

诺贝尔奖获得者Oliver Smithies。图片来源:University of North Carolina at Chapel Hill


1990年,Science 杂志刊登了一篇有争议的评估报告,它表明超过一半的学术论文在发表5年后仍然没有被引用[2] 。华盛顿大学信息学家Jevin West说:“科学家普遍会担心论文的引用问题。”毕竟被广泛引用是学术影响力的标尺,这不仅意味着你的论文被很多人读过,更说明你的研究对他人是有用的。West说他经常被熟人问:“有多少文献从未被引用过?”


蒙特利尔大学的信息学家Vincent Larivière则认为没有被引用过的论文不一定就没用,而且,数量也没有想象中的那么多。


那么多论文,有多少从未被引用?


为了探明这些被遗忘的学术研究黑暗角落,Nature 杂志重新挖掘数据,想找出究竟有多少论文没有被引用过。不过,由于引用数据库并不能完整收录人类所有的学术论文,因此这次努力并不能得出一个绝对准确的数字。


管中窥豹,可见一斑。在Web of Science收录的约12,000本期刊中,被引次数为零的论文数量要远少于预期。根据Web of Science的记录可以推测,大约有少于10%的科学论文可能永不会被人引用。实际数字可能更低,因为这些论文可能在某个Web of Science没有收录的地方被引用了。


但这并不意味着令人担忧的低水平研究变得更少——仍然有数以千计的期刊没有被Web of Science收录,仍然有很多科学家用毫无意义的论文来拉长他们简历中的Publication。


被人遗忘的学术角落


对无人引用的论文进行研究要从1990年[2]  和1991年[3]  两篇Science 文章算起,这两篇报告称55%的论文从没有被引用过。这和上文Nature 报告的低于10%为什么差距这么大?重要原因在于统计口径的区别。


1990年的那篇Science 评估的是1981-1985年间发表但在随后5年无人引用的论文,而且还把信件、更正、会议摘要等非学术内容也都包含在内,通常这些内容不会被引用。如果把这些非学术论文的内容去掉,只留下研究论文和综述,所得出的被引次数为零的论文比例会大幅降低。如果把“随后5年”这个限制也砍掉,该比例还会进一步降低。


2008年,Larivière和同事们重新分析Web of Science的数据,得到的结论是被引次数为零的论文数量低于预期,而且最近几十年来一直在下降。[4]  本文中,Nature 邀请Larivière和印第安纳大学伯明顿分校的Cassidy Sugimoto一道更新和解读关于无人引用论文的分析结果。


最新的数据表明,在大多数学科中,引用次数为零的论文数量在出版后的5到10年间会下降,但不同学科差异较大。2006年发表的所有生物医学论文中,只有4%的论文至今未被引用;化学学科这一比例为8%,物理学接近11%,工程技术领域更是高达24%。如果把自引(研究人员引用自己以往的论文)去掉,这些数字可能会上升一倍。另外,尽管无人引用论文的比例逐年降低,出版后10年是一个“生死线”。如果一篇论文发表10年后仍然没有被引用,基本可以认为它永远都不会被引用了。

图片来源:V. LARIVIERE & C. SUGIMOTO / WEB OF SCIENCE / Nature


整体来看,1900年到2015年底,Web of Science共收录了3900万篇论文,其中约有21%没有被引用过。那些没人引用的论文大多刊登在鲜为人知的小期刊上,而知名期刊(知名的门槛比你想象的要低)的论文几乎全都会被引用,当然,这并不令人吃惊。


难以精确的数值


人们可能永远不会知道那些未被引的论文究竟有多少。其难度在于手工检索的工作量太大。2012年,查尔斯大学的生物学家Petr Heneberg想分析一下13位诺奖获得者的论文引用情况。Heneberg检索了一番Web of Science,发现这些诺奖得主的论文约有1.6%从未被引用过,他再查阅Google Scholar和其他数据库后,他将这一比例进一步降低到0.3%。[5] 


这个小例子也反映出获得未被引用论文的真实数量几乎不可能,在几千万篇论文的规模上进行手工检查几乎是不可能完成的任务。学科上的差异也影响结论的准确性。2006年发表的65%的人文学科论文尚未被引用。的确,很多人文学科的进展并不像科学那样依赖于前人的积累。但Web of Science对人文学科的覆盖并不完全,忽略了很多期刊和书籍,这也是重要的原因。


此外,国家间的差距也使得评估难以准确进行。Web of Science显示中国、印度和俄罗斯的科学家撰写的论文比欧美论文更容易不被引用。除了学术水平的差距,Web of Science遗漏了不少这些国家的本土期刊,如果把这一点考虑在内,差距就会缩小。


看到这里,你会不会对目前学术期刊发表的质量恢复了一点信心?当然,数据摆在那里,怎么理解是见仁见智的事情。但Larivière认为未被引论文比例的下降主要原因是学术出版量的壮大和当今论文的参考文献量大涨,并不代表现在的科研工作比以前更有用质量更高。

不同学科篇均引用文献数量逐年上升,这也使被引次数为零的论文数量越来越少。图片来源:Nature


荷兰莱顿大学的文献计量学专家Ludo Waltman认同这一观点,他说有许多学术论文仅靠一两次可怜的引用才堪堪摆脱“无人引用”的尴尬局面。他和Larivière的数据表明,Web of Science中只有一两次引用的论文数量要多于被引次数为零的论文数量。他还说,“我们都知道很多引用都比较随意或者勉强。”纽约城市大学的健康经济学家Dahlia Remler则直截了当地戳穿了这个论文引用的小把戏,只有一两次引用可能是学者们互相“帮忙”的结果,“即便一些看起来引用很多的研究,也有可能是某些学术小团体自娱自乐的游戏而已,对大的科学问题或整个科学界没什么帮助。”


没引用不等于没用


“绝大部分没有被引用过的论文是垃圾”的观点没有问题,但仍有一小部分论文是埋藏在沙土中的金子。


有时候论文的价值不体现在是否被引用。路易斯安纳州立大学的植物学家Michael MacRoberts在1995年发表过一篇关于德克萨斯州Palhinhaea cernua苔藓的论文。直到2010年,这篇论文才被MacRoberts自己发表的一篇关于引用分析的论文引用。但1995年的MacRoberts制造了一个学术垃圾吗?事实并非如此,那篇论文的内容被收录在植物地图集和大型在线数据库中,供人使用。MacRoberts说:“这些所谓没有被引用的论文中的信息其实已经被人使用了,只是没有通过引用这种形式而已。”


另一个例子发生在公共卫生领域。2010年,纽约市健康和心理卫生部门的研究人员在PLoS One 上发表了一篇论文,。作者希望利用临床实践进行案例研究,探索出现问题时能否用该软件分析试剂盒的性能。这篇论文从未被引用过,但却被在线查看了1500次,下载了近500次。这项研究旨在改善公共卫生实践,而不是真正推动相关科研的进展,但其正面意义却不容忽视。数年前,这种试剂盒在临床上的使用被暂停,尽管随后又恢复了使用,但该文对于公共卫生实践的贡献已经体现了出来。


也有一些论文,要等上几十年甚至近百年,才能等来第一次被引用,就好比童话故事里等待拯救的“睡美人”一样。其中最著名的例子当属Albert Einstein、Boris Podolsky和Nathan Rosen在1935年发表的量子力学论文,[6]  它在长达数十年的时间无人问津,直至1994年才被第一次引用,而时至今日这篇文章的被引次数已经超过16000次(点击这里,了解更多“睡美人”论文)。


最后,让我们把Oliver Smithies的故事说完。在2014年的一次会议上,Smithies发言时说道,他知道那篇1953年的论文的价值,尽管那篇论文从未被引用过(实际上有9次引用)——那篇论文之后的工作帮助他获得了博士学位,从此他成为了一名成熟的科学家。你可以把那篇论文看作大师的学徒期作品。Smithies说:“我喜欢那篇论文,从中我学会了如何做好科学研究。”Smithies的论文目录中的确有一篇无人引用的论文——1976年发表的一篇关于某个特定的免疫系统基因位于人类第15号染色体上的论文。[7]  哈佛医学院的遗传学家Raju Kucherlapati是这篇论文的合作者,他认为那篇论文是他与Oliver Smithies实验室长期合作的开始,最终在小鼠遗传学方面的工作为Smithies赢得了2007年诺贝尔生理学或医学奖。对Kucherlapati而言,“那篇论文的意义在于让我认识了Oliver”。


氘评


论文的引用量就像其他所有用来评判科研成果优劣的指标一样,只能反映一部分事实。我们既不能忽视它,也不能盲目追求它。什么是好科学?我们应当有自己的看法。


编译自:

The science that’s never been cited

Richard Van Noorden

Nature, 2017, DOI: 10.1038/d41586-017-08404-0

https://www.nature.com/articles/d41586-017-08404-0


参考文献:

1. Smithies, O. A dynamic osmometer for accurate measurements on small quantities of material: osmotic pressures of isoelectric β-lactoglobulin solutions. Biochem. J., 1953, 55, 57-67

2. Hamilton, D. P. Publishing by--and for?--the numbers. Science, 1990, 250, 1331-1332

3. Pendlebury, D. A. Science, Citation, and Funding. Science, 1991, 251, 1410-1411

4. Larivière, V., Gibgras, Y. & Archambault, E. The decline in the concentration of citations, 1900–2007. J. Assoc. Inform. Sci. Tech., 2009, 60, 858-862

5. Heneberg, P. Supposedly uncited articles of Nobel laureates and Fields medalists can be prevalently attributed to the errors of omission and commission. J. Am. Soc. Inf. Sci. Tech., 2013, 64, 448-454.

6. Einstein A., Podolsky B., & Rosen N. Can Quantum-Mechanical Description of Physical Reality Be Considered Complete? Phys. Rev., 1935, 47, 777

7. Kucherlapati, R. S., Faber, H. E., Poulik M. D., Ruddle, F. H. & Smithies, O. Assignment of the gene for beta-2-microglobulin to human chromosome 15. Cytogenet. Cell Genet., 1976, 16, 178-180


(本文由氘氘斋供稿)



本文版权属于X-MOL(x-mol.com),未经许可谢绝转载!欢迎读者朋友们分享到朋友圈or微博!


长按下图识别图中二维码,轻松关注我们!


点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊