科学诚信侦探Elisabeth Bik

May 26, 2020 No Comments

Elisabeth Bik辞去了工作，专注于发现研究论文中的错误，并已成为科学诚信侦探的公众代言人。

2月14日，与往常一样，Elisabeth Bik躺在床上查看手机，浏览大量Twitter通知和来自寻求她的侦探服务的科学家的私人信息。今天的第一个请求来自比利时的一位研究人员：“嗨!我知道有很多人请求你分析数据、blot条带和其它东西，但我只是想问问你的意见……”

在倒了一杯咖啡后，Bik在她位于加州森尼维尔的家中，坐在木制长餐桌前查看电子邮件，并仔细阅读了来自那名比利时研究者的信息。附件是发表的一篇研究论文的western blot（一种常用的、检测生物样本中蛋白质表达的方法）图像。发件人想知道的是，Bik在这篇文章中看到了什么可疑的东西吗？这些照片是否经过了PS处理？

Bik是一名来自荷兰的微生物学家，大约20年前移居美国。她是一名鼎鼎有名的科学诚信侦探，擅长找出文章里的重复图片。通常，一天内她会用眼睛浏览几十篇生物医学论文，寻找图片被重复使用，并作为不同实验的结果被报告的实例，或者图片的某些部分被克隆、翻转、移位或旋转以创建“新”数据的实例（图：你是超级观察员吗?）。

她的技巧和毅力为她赢得了全世界的追随者。意大利Samone研究诚信公司的联合创始人Enrico Bucci表示，她有一种非凡的能力，即使是最复杂的图片伪造操作，她也能察觉出来。并不是每一个有问题的图片都意味着一篇论文具有欺骗性或是错误的。但也有一些确实如此，这引起了许多研究人员的深切关注。华盛顿大学（University of Washington）的微生物学家Ferri Fang认为，这是一个可怕的问题，科学文献的数据不可靠。Fang曾与Bik合作分析了超过20000生物医学论文，发现其中4%有图片重复使用的问题（E. M. Bik et al. mBio 7, e00809-16; 2016）。Fang表示，这些假数据让博士后和学生浪费数月或数年去探索那些最终被证明是无效的东西。

Bik并不是世界上唯一的图片侦探，但她在公开展示自己作品的方式上是独一无二的。许多图像检查人员在幕后工作，将他们的发现发表在研究论文中，并私下向期刊写信；少数人受雇于期刊或机构。有些人用假名工作，不愿公开身份。但是Bik几乎每天都在Twitter和其它在线论坛上发布她的发现。在这个过程中，她教别人如何发现重复，并迫使期刊调查论文。Bucci指出，通过这样，Bik引发了“雪崩反应”和对这个问题的认识。Bik估计她的发现已经导致了至少172个撤销和300多个勘误和更正——但她认为，她的警告似乎经常被忽视。

2019年4月，Bik宣布她辞去了在一家生物医学初创公司的带薪工作，并将在至少一年里全职从事图片数据完整性工作，而且是无偿的。一年过去了，她没有表现出任何想改变方向的迹象——尽管她曾面临骚扰，而且有时会被请求淹没。她还与试图开发软件的计算机科学家分享了她的文件，这些软件可以识别数百万份文件中的重复图像，尽管这些程序可能总是需要人工验证。她非常喜欢这份工作，觉得自己只想继续做下去。

爱上图片查重

2013年左右，Bik作为加州斯坦福大学（Stanford University）的一名专职科学家，看到了一些关于科学诚信和剽窃的文章，这大大燃起了她的兴趣。出于好奇，她在Google上搜索了自己发表论文的引文，很快发现其他作者在没有注明出处的情况下剽窃了文章。Bik指出，她很在意这个，非常生气，随后立刻迷上了图片侦查，就像其他人着迷于阅读有关犯罪的书籍一样。有一次，在检查一篇含有抄袭内容的博士论文时，更引人注目的东西吸引了她的目光：一幅存在明显问题的western Blot图像出现在了两个章节里，据说是两个独立的实验。Bik发现，这些章节也以研究文章的形式发表，同样存在错误。2014年1月，她给该杂志的编辑发了一封电子邮件；同年6月，她在PubPeer网站（一个科学家可以讨论发表的论文的平台）匿名发表了这些评论。这是Bik在文献中第一次报道了可疑的数据操控行为。经过俄亥俄州凯斯西储大学（Case Western Reserve University）的调查，相关文章于2015年和2016年被撤回。

寻找和编目这些图像成为了一种爱好。然后Bik联系了Fang和约翰霍普金斯大学的微生物学家Arturo Casadevall。三人认为，Bik罕见的才能可用于深入调查生物医学工作中出现问题的频率。他们抽样了20621篇论文，每一篇都由Bik进行筛选——Fang表示，这是只有Bik才能完成的任务——然后把她的发现交给Fang和Casadevall证实。Fang认为，这就像一个魔术，一旦揭秘，你就能明白为什么是这样。研究小组发现了782篇论文，他们称之为“不适当的”重复，Bik通知了相关期刊。该团队在2016年的mBio杂志上报道了这项工作，Casadevall是该杂志的主编。

Bik把大量的业余时间都花在了侦察存在重复的图片上，去年她决定辞去加州福斯特城Astarte Medical科学主任的工作。Bik意识到，她对图片复制工作的热情要高于她的实际工作。”

澳大利亚悉尼大学（University of Sydney）的分子生物学家Jennifer Byrne指出，这是一个令人印象深刻的决定。Byrne自己也是一名数据完整性追求者，她会侦察发表文献里有问题的基因测序数据。Byrne认为Bik的决定“非常勇敢，相当无私”。Bik的大部分工作都没有报酬，但偶尔会做一些有偿咨询，并通过Patreon众筹页面获得少量报酬。经过几十年的工作和储蓄，她希望自己目前的状况能够无限期地持续下去。

复制数据库

Bik现在在一间采光充足的餐厅里工作，餐厅里有落地窗，可以俯瞰一个种满果树和其它植物的花园。她还为自己收集的近2000个海龟雕像制作了电子表格，这些雕像是从旅行和朋友那里收集来的，她把它们放在玻璃柜的墙上。然而，在她所有的电子表格中，最珍贵的是一份包含3300多份可疑文件的合集，其中大部分都因为图像问题而打上了标记。（Bik有时会对论文提出其它问题，比如围绕剽窃或利益冲突的问题。）

在没有中断的一天里，Bik可以阅读100篇左右的论文，在她的数据库中增加1到20个条目（图：超级观察员测试：高级水平）。图片重复、数据点的类似分布，数据复制的迹象一点点被Bik挖掘出来。收集的数量大到足以产生自己的线索。她寻找mBio数据集的其他论文作者数据造假的迹象，例如，导致Bik成为去年新闻头条的一个重大发现：中国南开大学校长、呼吁更严谨的数据完整性的著名免疫学家曹雪涛的大量论文可能存在造假。（大多数文章的附属机构都写了其任职的上海国家医学免疫学重点实验室。）Bik和其他一些匿名评论者在PubPeer的60多篇论文中指出了明显的问题。

中国教育部表示将对这些文章进行调查，曹雪涛在PubPeer上回复，将重新检查文稿，他相信这些出版物是可信的。一些作者在网站上迅速回复，指出一些明显的错误。在一个案例中，明显重复的图像实际上应该代表相同的实验，但却没有被清楚地标记出来，Bik接受了这一解释。在另一篇文章中，作者贴出了原始数据，并表示只有在为论文进行处理后，这些数据才显得相似。还有一些论文的作者表示，论文中出现了意外错误，截至今年5月，有13篇被标注的论文得到了更正，其中大多数都说科学结论没有受到影响。（曹雪涛和中国教育部没有就本文进一步置评。）

有时候，Bik的发现指向了大规模的可疑行动。今年，她和其他人标记了一系列超过400份的论文。Bik等人指出，这些论文有如此多的相似之处，以至于它们可能是一家“造纸厂”的产品。“造纸厂”是指一些提供订制论文攥写、发表的公司。几名图像侦探对这些论文进行了标记和校对，其中包括假名侦探@mortenoxe、@TigerBB8和@SmutClyde。他们于1月在科学记者Leonid Schneider运营的博客上发布了一份论文清单。Bik于2月在她自己的博客上写道：找到这些伪造的图片不应该仅仅依靠无偿志愿者的工作。多家期刊表示，他们正在对这些论文进行调查，其中许多论文是由中国医院的医生撰写的，一些论文已经在准备撤回。

Bik的数据揭示了一些与图像复制相关的因素。她的mBio论文报告显示，在影响较小的期刊上，重复的图片有轻微的出现频率较高的趋势。这篇论文还研究了 PLoS ONE杂志上标记的348篇文章的一个子集：考虑到该杂志的发表频率，来自中国和印度的论文似乎更有可能包含有问题的图片。但Bik并不针对某个国家的作家。Bik在11月写道，她搜索有问题的论文，不管它们来自哪个国家。总的来说，Bik已经在49个国家的主要作者的论文中标记出了副本。

Gamified侦查

几乎每一天，Bik会把疑似存在重复性问题的图片发布到推特标签# ImageForensics下，作为谜题挑战她的粉丝——在过去一年她的粉丝数增长了近两倍，已超过60000——让粉丝去找图片里的疑似之处（图：超级观测者测试：到处都是重复）。谜题在几分钟内吸引了无数的猜测，一些目光敏锐的玩家发现了她漏掉的问题。（她会给表现最好的人颁发表情符号奖章。）Bik指出，她从一些追随者那里听说，他们从她那里学到了技能，在同行审阅手稿时发现了有问题的图片。Bik觉得她正在改变人们看待这些图片的方式。这项工作有时会让Bik难以承受，她称自己为“超级内向者”。去年11月，她在推特上写道，她收到了很多（匿名）邮件，有人想让她检查某些作者或论文，她可能无法跟进。这么多名字……诚实的科学家对这些不诚实的同事有这么多隐藏的痛苦。

Bik还向PubPeer发布了她所看到的详细报告，偶尔也会在那里发表评论，支持其他线人。许多PubPeer的用户都以笔名发表他们的批评——如果作者好打官司的话，Bik可能也会选择匿名。但自2014年以来，她以自己的名义在该网站上发表了2100多条评论。Bik的与众不同之处在于她愿意表明自己的身份，这是非常令人钦佩的。《细胞生物学杂志》（Journal of Cell Biology）前总编辑、加州旧金山咨询公司Image Data Integrity总裁Mike Rossner表示吗，它当然有助于人们认真对待这些指控。

Rossner认为，失业和独立给了Bik表达自己想法的自由。今年3月，Bik在推特上指出，看起来没有人会花时间去整理一篇好的科学论文。去年7月，Bik在一张图片上评论：对于那些在2005年左右没有获得NIH R01资助的人来说，那些资助都花在这里（伪造图片）了。

但也存在风险，尤其是对那些在Twitter上自称“率直、刻薄”的人来说。Bik表示，在某种程度上，她担心人们会起诉她。她尽量把评论保留在研究论文中，而不是指责作者。Bik没有面临诉讼，但一直受到骚扰，有时会离开Twitter。一个人给她在斯坦福大学（Sandford University）的前同事发了一封电子邮件，称她在工作时间进行图像完整性调查，滥用了研究拨款（Bik否认了这些说法）。另一个人在PubPeer上发布了Bik的个人信息（现已删除）。Bik被骂过几次，但这是她工作的一部分。

Bik表示，她是用真名发帖的，但她犯了一些过于谨慎的错误，有时决定不标记网上的案件，尤其是那些图像模糊或低分辨率的案件。在她自己的科学诚信博客上，许多条目的开头都有这样的句子：这篇文章不是对行为不端的指控。可疑的图片并不总是指向腐败的行为，她指出，例如，研究人员在准备数据时可能错误地上传了两次文件。此外，还有一些技术上的伪迹：从一块组织上按顺序切下的薄膜薄片，可以沿着一边粘在一起，像蝴蝶一样翻转，因此看起来就像是镜像复制。旧显微镜上的缺陷可以在每张图像上产生看起来相同的黑点。

EMBO杂志的主编Bernd Pulverer认为Bik有着良好的记录。他称Bik是伪造图像筛选的世界领导者。Bik说出来的东西通常都是真正的问题。

公开或私下

尽管许多人称赞Bik的工作，但一些人指出，在这些担忧私下里被期刊或研究机构证实之前，不应该在公开场合公布。美国研究诚信官员协会（US Association of Research Integrity Officers）主席Lauran Qualkenbush表示，这很成问题。她认为，在涉嫌造假的案件中，公开曝光可能会妨碍大学的调查程序。她还提醒，如果有人确实故意进行了不当研究，然后他们得到了提醒，这对他们来说是一个销毁证据的好机会。

和其他图像侦探一样，Bik说自己已经试着私下告诉杂志，但是通常的结果是石沉大海或长时间才有结果。（她还指出，即使调查是在私下进行的，研究人员也有机会销毁证据。）从2014年到2015年，Bik通过电子邮件直接向期刊报告了她在2016年开展的mBio研究中所有782篇有问题的论文。一些期刊对Bik的大量报告毫无准备。她在30封电子邮件中标出了Plos ONE杂志的348篇论文，每封邮件都有10或20个附件。总编Joerg Heber指出，这显然造成了积压，因为他们没有准备好去处理它。最终，在2018年，该杂志成立了一个三人小组，专职调查图像完整性和其它问题。Heber等人去年发布了大约100个撤销。这些都是Bik提出的案例。该团队仍在研究Bik的原始技巧，以及其他案例。Bik赞扬了PLoS ONE的努力，并说她经常收到来自Bik的线索的PLoS ONE撤销和更正的通知。但是，由于mBio数据集中的近800个案例中有许多仍未得到解决，Bik的耐心正在逐渐消失。Bik表示，5年后，还有60%到70%的问题没有得到解决，所以现在，是的，她将更公开地讨论这个问题。

Pulverer指出，用尽职调查的方法来检查文件中的问题所花的时间，通常比人们预期的要长得多。他和Heber注意到，等待作者的回复和原始数据，有时是研究机构，可能是很耗时的。

Bik说她意识到调查需要时间。但她认为，在可能长达数年的调查悬而未决的情况下，期刊可以更迅速、更频繁地使用表达关注的方式来通知其他研究人员潜在的问题。Heber表示，PLoS ONE在收集到足够的信息来表达关注前，会使用需要关注的表述，但如果调查进展顺利，可能会暂时搁置，以便达成解决方案，如更正或撤回。《自然》（Nature）杂志主编Magdalena Skipper指出，关注的表达是“科学记录中正式和永久的一部分”，它提醒读者关注一篇论文的“严重问题”；因此，我们努力明智地使用它们，一旦我们有证据表明这样做是适当的，就将它们添加到文件中。

这些天，Bik通常直接在PubPeer上报告她的发现。一些期刊和出版商跟踪网站上的活动，这样她就可以联系期刊编辑和公众。她认为，更重要的是标记这些论文，不要担心这些研究所的幕后情况。

包括Bik在内的许多人认为，打击图像操纵和复制需要科学出版的全系统变革，例如对已被接受的手稿进行更大程度的预先筛选。Rossner指出，他的偏好不是必须清理已发表的文献，而是提前做。大约20年前，Rossner在《细胞生物学杂志》（Journal of Cell Biology）上帮助介绍了对已被接受的手稿进行普遍图像预先筛选的方法。在EMBO出版社，杂志从2013年起就开始对有缺陷的图片进行预先筛选。但是大多数期刊仍然没有预先筛选或者（像《自然》杂志那样）在发表前只抽查一部分论文。威利出版社的诚信研究主管Chris Graf表示，目前，图像筛选并不常见。

但潮流正在慢慢转向：威利出版了一些筛选图片的杂志，Graf指出，他正准备与《细胞生物化学杂志》（Journal of Cellular Biochemistry）和《细胞生理学杂志》（Journal of Cellular Physiology）合作，推出一项筛选服务。执行主编Monica Bradford表示，《科学》（Science）杂志有编辑协调员，他们会检查已被接受的稿件是否有篡改图片的迹象，但他们没有检查某些问题的能力，比如图片是否被翻转、旋转或复制。

人工智能或有大用？

许多研究人员表示，自动化是大规模提高图像完整性的关键。纽约雪城大学（Syracuse University）的计算机科学家Daniel Acuna指出，不幸的是，我们不能克隆Bik。他的团队是少数致力于用算法检测有问题的图像的团队之一。尽管Bik擅长在一篇论文中找到重复的图像，但是计算机可以通过比较数十万或数百万篇论文来帮助找到更多的重复图像——这对人类来说是一项不可行的任务。2018年，Acuna的团队在bioRxiv预印本服务器上发表了一项分析的初步结果，该分析从76万篇论文中提取了200万幅图像（D. E. Acuna et al. Preprint at bioRxiv http://doi.org/dtp2; 2018）。事实证明，这种方法的计算量太大，无法将每张图片与其它图片进行比较，但研究团队考察了同一作者的论文中以及论文之间的图片重用情况。在手动检查了软件标记的3700多张匹配图像样本后，研究人员确定了40个案例，他们都认为这些案例可能存在欺诈：几乎一半的研究都是用相同的图像来代表不同论文的不同结果。

Bucci指出，目前的技术擅长于检测完全的复制，以及翻转或旋转的副本。他的公司使用专有软件为客户扫描科学手稿，客户包括期刊和研究机构。但是复杂的问题更困难，例如两个图像共享一个小的重叠区域，但在其它方面是完全不同的。他表示，机器学习的进步可能是自动检测这些和其它微妙模式的关键。

但是更好的软件需要更多的数据。机器学习算法需要使用已知包含重复的大量图像进行训练。Bik与Acuna分享了她2016年研究的数百张“脏”和“干净”的论文图片。在柏林洪堡大学（Humboldt University of Berlin），出版商爱思唯尔（Elsevier）资助的研究人员正在开发一个可搜索的数据库，收录被撤回论文的图片，目前只有不到500个条目，大部分都是由爱思唯尔提供的生命科学和医学方面的内容，所以该团队希望有更多的出版商参与进来。该出版商指出，它的一些期刊正在试验图像检测软件，它的目标是为所有期刊提供自动化的系统检测。

不久之前，Bik还对可用的软件不以为然。但现在，她完全有信心在未来两年内，电脑将可用来大量筛选手稿。但Bik和Acuna都表示，人们总是需要检查这类程序的结果，特别是要剔除图像在某些部分可以，而且应该看起来相似的情况。

目前，Bik还有很多工作要做。今天早上来自比利时的消息看起来可能会很受欢迎。她表示，一些wester blot条带——通常是模糊的、圆形的，就像小的黑色毛毛虫——有不同寻常的锐利像素化的边缘；当图片被压缩到一个更小的尺寸时，从图片上就能看到明显的伪迹，当然这也可能是图片编辑工具留下的痕迹。Bik打算向他要文章的剩余部分。

原文检索：
Helen Shen. (2020) Meet this super-spotter of duplicated images in science papers. Nature, 581: 132-136.
张洁/编译

人物特写, 热点

生命奥秘

科学诚信侦探Elisabeth Bik

爱上图片查重

复制数据库

Gamified侦查

公开或私下

人工智能或有大用？

Leave a Reply

热点 · 最新文章

最新评论

About

Special

Social