一、先搞清楚:这个工具到底是干嘛的?
Imagetwin说白了就是一个图片版的查重软件。
你交论文的时候,期刊编辑会用类似的工具扫一遍你的图片,看看有没有:
同一张图在论文里出现了两次
两张不同的图其实是一样的(被旋转、裁剪、调过亮度)
你的图和别人已发表的图撞车了
Imagetwin就是让你投稿前自己先扫一遍,有问题自己先改,别等编辑发现了再解释。
目前它被美国微生物学会(ASM)旗下15本期刊正式采用,算是行业内认可度比较高的工具之一。
二、它能查的3类图(重点)
第一类:显微镜照片(查得最准)
包括: 电镜图、荧光显微镜图、组织切片图、免疫组化图。
这类图的特点是背景复杂、有纹理。Imagetwin的算法就是专门为这类图设计的——它会提取图片里的“指纹”,比如细胞排列的方式、颗粒分布的位置,然后在整个论文里找有没有相同指纹的图。
效果怎么样? 根据ASM 2023-2024年的测试数据,Imagetwin对显微镜照片的准确率在90%以上。也就是说,它说有问题的,十有八九真有问题。
一个常见情况: 你拍了一组不同浓度的药物处理后的细胞图,结果不小心把对照组的图复制到了两个不同的浓度下面。Imagetwin会直接标红,告诉你这两张图是一样的。
第二类:凝胶电泳图(查得最细,但容易误报)
包括: Western Blot条带图、PCR凝胶图。
这类图是Imagetwin的强项,但也是个双刃剑。
强在哪?它能检测出非常隐蔽的操作:
同一条带被复制到不同的泳道
不同泳道的条带形状完全一样(说明是复制粘贴的)
背景被处理过,但条带本身没变
数据: 过去几年的学术撤稿里,超过40%的图片造假案例跟WB条带有关。所以期刊对这个特别敏感,Imagetwin在这方面也做得最细致。
但问题来了: 它的误报率也不低。什么意思?就是你跑出来的两个不同样本的条带,因为形状本来就有点像,它可能也给你标成可疑。
举个例子: 你做了两个不同的蛋白,分子量接近,条带位置差不多。Imagetwin可能会把它们标成“可疑重复”。这时候你得自己看:这两个条带来自不同的膜、不同的抗体,那就不是问题。
第三类:普通实验照片(能查,但效果一般)
包括: 小鼠肿瘤对比照片、植物生长照片、菌落平板照片、实验装置照片。
这类图的特点是背景往往很相似——同一台相机、同一个灯光、同一个角度拍的。
所以Imagetwin容易“过度敏感”。你拍了一只小鼠手术前后的两张照片,背景一模一样,它可能也给你标红。
怎么办? 人工判断。如果是同一个动物、不同的时间点,那就不是重复,是正常的。放行。
三、它不能查的3类图(千万别以为它都查了)
这是最容易踩坑的地方。很多同学扫完看到报告说“没有发现问题”,就放心投稿了。结果审稿人回头指出:你这图3A和图5B的柱状图数据重复了。
Imagetwin根本不查柱状图。
第一类:统计图表(完全不能查)
包括: 柱状图、折线图、散点图、箱线图、饼图。
这些是“画出来的”,不是“拍出来的”。Imagetwin的算法不认这类图。
那怎么查?
自己记住:哪个数据用在哪张图
投稿前把所有统计图摊开,看看有没有重复的数据
用原始数据核对一下
第二类:示意图(完全不能查)
包括: 信号通路图、实验流程图、机制示意图。
这些也是画出来的。就算两张图长得像,也可能是参考了同一篇文献或者用了同一个PPT模板,不一定是重复。
第三类:表格(完全不能查)
Imagetwin只查图片格式的文件,表格它不管。
四、拿到报告后,怎么做?(实操步骤)
假设你花了200块钱,上传了PDF,等了10分钟,拿到一份报告。报告里有红标、黄标。
第一步:别慌
红标代表“高度可疑”,黄标代表“中等可疑”。但这只是机器的判断,最终决定权在你。
第二步:一个个点开看
Imagetwin会把可疑的两张图并排显示,你放大看细节。
问自己三个问题:
这两张图真的是同一张吗?还是只是像?
如果真的是同一张,它是该出现在两个地方的吗?
有没有原始实验记录能证明它们是不同的样本?
第三步:分情况处理
情况 | 怎么做 |
|---|---|
确实放错了(同一张图放了两次) | 替换成正确的图 |
工具误判(两张图只是像,但不是同一张) | 不用改,但最好在图注里加一句说明 |
不确定 | 找原始数据,或者问师兄/导师 |
第四步:自己再查一遍它查不了的东西
把你论文里的所有柱状图、折线图、示意图、表格,全部摊开,用肉眼过一遍。问自己:我有没有在不同地方用了同一组数据?
五、一个完整的使用案例
学生小王写完一篇SCI,准备投一个5分左右的期刊。投稿前我用Imagetwin帮他扫了一遍。
扫描结果:
红标2处
黄标5处
逐个分析:
红标1:图2B和图4D的免疫荧光图被标成重复。小王一看,坏了——他确实把同一个样本的两张不同通道的图搞混了,放成了同一张。替换图片。
红标2:图3A的WB条带和图3C的WB条带被标成可疑。小王查了原始数据,发现这是两个不同的蛋白,分子量接近但确实不同。原始胶片能看出来。他没改,但准备好了原始数据,万一审稿人问能拿出来。
黄标5个:都是显微镜照片,因为同一批实验拍的,背景相似。小王判断不是问题,忽略。
然后他自己手动查了柱状图,发现图5A和图7B用的是同一组对照组数据,但忘了标。加上标注。
最后投稿,审稿人没提图片问题。一次过。
六、省钱小贴士
Imagetwin扫一篇PDF大概200块人民币。如果你是学生,觉得贵,有两个办法:
合买:同一个实验室的同学,几篇一起扫,稍微便宜点(但注意别混了报告)
免费替代方案:国内有个工具叫Figcheck,免费,但一周只能用一次,准确率偏低。如果预算紧张,可以先用Figcheck扫一遍,有可疑的地方再用Imagetwin确认
但说实话,200块钱买一次投稿的安全感,我觉得值。被退稿一次浪费的时间和精力,远不止200块。
七、最后说三句大实话
工具是帮手,不是保险。 Imagetwin说没问题的,不代表真没问题(它漏报率30-40%)。它说有问题的,也未必是真问题(误报率20%)。最终还是得你自己判断。
最笨的方法最稳。 投稿前把所有图片打印出来,一张一张贴在墙上,用肉眼对一遍。加上工具扫描,双重保险。
别指望工具替你掩盖问题。 如果你是故意造假的,什么工具都救不了你。近年期刊的图片筛查越来越严,2024年好几本期刊已经启用了更高级的AI检测工具。老老实实做科研,比什么都强。
关键词:
Imagetwin使用教程、SCI图片查重、论文图片重复、Western Blot、科研工具、学术投稿、图片误判处理