时隔15年的论文因数据丢失被撤!数据怎么保存才安全?

3月资源包:关注 "螺旋" 微信公众号,回复关键词"3月"可索取DNA序列分析软件。


Discussion写作模板 | SCI作图 | qPCR曲线 | 自噬相关mTOR信号 | ELISA实验

 作者:麦子(转载请注:解螺旋·医生科研助手)


撤稿观察网(Retraction Watch)不久前发布了一则撤稿消息, Ziegler-Graff于15年前发表的一篇文章(J. Virol. July 2002 vol. 76 no. 13 6815-6824),被发现多幅Western blot和Northern blot插图的有问题,包括同一泳道图像重复生成不同的插图、不恰当的对比度调校等。



责任落到了负责配图的一作S. Pfeffer肩上。该实验室重复了实验,确认了当年的结论,也有其他好几个实验室独立进行了确认。本来可以用原始图像生成正确的插图纠正过来,然而,因为不能提供所有的原始数据,通讯作者最后还是决定,主动要求把它撤了……


这故事听起来有点别扭,也有点悲伤。15年了,原始数据找不到了。这和2013年的另一件事蜜汁神似,那是2007年的文章(J Clin Invest. 2007;117(11):3412–3420.),相隔6年。



Fig.5中的某几幅图有复制之嫌,其他图片倒没问题。又是研究者不能提供原始数据,所以期刊决定把Fig.5给撤了。



这有理没理已经是鬼知道了。如果第一个故事中,真的是一作把通讯给坑了,通讯拿不出原始数据那是真惨。然而,数据为什么会丢呢?


我们做完实验写好文章,通常单位、资助机构和某些杂志会要求提交原始数据,上传云端或刻入光盘,谨慎一点的也会自己再私存一份。不过要是过了很多年,发生点变数也是有可能的,服务器运行不下去了,空间满了被删了,光盘被狗狗叼走了……


难道没有更好一点的办法?


Dryad:大型公共科研数据库


Dryad是2008年9月由美国国家科学基金会资助建立的非盈利性共享科研数据库,推动各学科的科研数据开放共享。一方面长期保存了出版物背后的数据,另一方面也使它们可被发现、可重复使用、可引用,让其他学者从历史数据中创造新的价值,也可用真实数据进行科研教育。(地址:https://datadryad.org/)



当然它是指向数据提交者收费,向其他使用者免费开放。不过国家级的嘛,其安全性和稳定性自然是有保障的。它有详细而完善的数据保存策略,包括备份、迁移、故障应急预案等,也有专门的程序来监测数据的流通、识别非法操作。显然那两个悲惨故事的文章都发表得比较早,没赶上好时代。


这不仅是数据保存的问题,还有数据的共享,使科研成果更透明。所以,2003年,OECD(经济合作与发展组织)便提倡,所有公共财政资助的研究所获数据都应公开共享,并于2007年发表《公共资助科研数据获取原则与指南》。2008年,便有期刊出版商如PloS ONE响应,制定数据共享政策,建议研究者在发表文章时提交Supplementary Data,并将数据保存在开放获取的数据库中,如GenBank、Dryad。


现在的文章,附有Supplementary Data的已经比较常见了,但也不一定包含所有原始材料,Dryad仍有它的优势。它身为作者和期刊之间的第三方公共数据库,有自己的一套管理审核措施。它接受所有类型的与出版物相关的原始数据,包括文本、图像、表格、音频、视频等等,默认情况下与文章一同发表。数据提交后会获得永久可解析的DOI标识,便于引用和交流。


如果文章被撤,或惹上了“编辑部关注”,Dryad中的数据仍然保留,并会附以提示,并提供相关声明的链接。所以撤稿是不是冤枉了你,问心无愧的话大可吆喝一声让大家评评理啊。


当然,要真做了亏心事,那你说没保存好就没保存好吧,横竖都是一撤。

参考资料:

1.http://jvi.asm.org/content/76/13/6815.short

2.http://www.jci.org/articles/view/70657

3.林芳芳, 赵辉. 美国Dryad数据库共享政策及启示. 中国科技资源导刊. 2015, 47(6): 48-52, 94.

4.https://datadryad.org/pages/policies


投稿邮箱: tougao@helixlife.com.cn

合作微信:helixlife6


点击底部阅读原文可免费报名课程