一项对近1.2万份人类遗传学论文的计算机分析研究发现,超过700项研究的实验试剂DNA或RNA序列存在错误。澳大利亚悉尼大学(University of Sydney)癌症研究人员Jennifer Byrn领导的团队指出,这是一个“令人担忧的问题”,因为这表明有一部分有关人类基因的研究是不可靠的,令人担忧。这些错误可能是偶然的,但研究人员也怀疑可能存在学术不端。
自2015年以来,Byrn一直在研究遗传学研究中的错误,当时她在五篇报告一项常见实验的论文中发现了问题:使用一小段DNA使癌细胞中的一个基因失活。这些研究报告了他们进行的实验中出现了错误的核苷酸序列,而这并不是这些论文唯一的问题,文章还使用了相似的语言和数据,Byrn怀疑它们论文制作商的产品。目前四篇论文已经被退回。
Byrn继续寻找有类似错误的论文。到2017年,她与法国格勒诺布尔大学计算机科学家Cyril Labbé合作,开发了名为Seek & Blastn的软件,可以标记潜在的错误。它从论文中提取短核苷酸序列,并与公共核苷酸数据库Blastn进行比较,检查它们是否与应该靶向的人类基因匹配。研究人员也手动检查每个标记不匹配。
为了衡量这个问题的严重程度,研究小组筛选了他们知道之前发表过有缺陷的论文的两家杂志:Gene(研究小组检查了2007年至2018年发表的所有7400篇原创论文)和Oncology Reports(2014年至2018年发表的所有3800篇开放获取论文)。经过人工检查,在Oncology Reports检查的论文中,约有12%的论文出现了错误。
有针对性的搜索
Byrne和她的团队还指出了癌症遗传学的三个子领域,他们此前在这些领域发现了问题:关于特定类型的microRNA 在癌细胞中的作用的论文;报道顺铂或吉西他滨治疗癌细胞或癌症患者的论文;还有一些论文报道了消除17个基因中的任何一个的活性,从而确定它们在癌细胞中的功能。研究小组发现,在这些亚领域的约600篇论文中,超过25%的论文含有核苷酸序列错误。
Jennifer Byrn
研究人员在7月31日发表在bioRxiv上的一份预印本中说,总共有712篇论文——约占筛查总数的6%——在其核苷酸试剂的序列中存在错误。这些研究发表在78份期刊上,被引用总数超过17000次。(其中29项研究发表在Springer Nature上,Nature表示将对相关论文进行调查)。在712项研究中,只有11项被撤回,3项表达了担忧。Byrne说,她的团队现在已经给所有相关期刊或出版商的编辑发了电子邮件,他们可以找到联系方式,有些人回复说他们将调查这些论文。
Oncology Reports主编、病毒学家Demetrios Spandidos告诉Nature杂志,Byrne已经联系了他,但还没有足够的时间来评估手稿中描述的所有数据。Gene杂志的主编、分子生物学家Andre Van Wijnen没有回应。
无意的错误?
Byrne说,有些问题可能是无意的错误。但是,她说研究人员发现了许多不太可信的错误,比如聚合酶链反应本应用来扩增DNA。
研究人员写道:“我们发现,人类基因功能论文中核苷酸序列错误的比例高得令人难以接受,这对旨在将基因组学投资转化为患者的研究领域是一个重大挑战。”这样浪费了科学家试图跟踪此类研究的时间,最坏的情况是,论文可能是伪造的,研究可能不可靠。