关键词
Turnitin图片查重;论文图片重复;Proofig;SCI图片查重;Turnitin功能限制
一、先说结论:Turnitin不查图片
这个问题我每年都会被问到无数次。学生的困惑通常来自两个方向:
第一种:论文里放了很多图,担心Turnitin会不会因为这些图导致相似率虚高。
第二种:担心自己用的图是不是和别人重复了,想知道Turnitin能不能查出来。
两个问题的答案其实是一样的:Turnitin不查图片内容。
这不是我个人的推测,而是Turnitin官方和全球多所大学白纸黑字写明的。
英国布里斯托大学的官方说明写得很清楚:Turnitin“不会检测图形材料中的相似性,比如图表、图片或公式” 。澳洲莫纳什大学也明确指出:“目前,Turnitin无法检查图片是否存在抄袭。例如,如果学生将基于文本的表格或图表保存为图片,Turnitin将无法读取图片中的文本” 。
雷丁大学的学生指南也说了同样的话:“作业中包含的任何图片、绘图、示意图或平面图都不会被相似报告检测到,因为这些不是文本” 。
所以,结论非常明确:Turnitin是一个文本比对工具,不是图片比对工具。
二、为什么Turnitin不查图片?原理其实很简单
Turnitin的工作原理,说白了就是读文字、比文字。
你提交一篇论文,Turnitin会先把文件里的文字提取出来,然后和它数据库里的几十亿页文字内容做比对。发现有相同或相似的句子,就标出来,最后算出一个相似率百分比。
图片是什么?图片是一堆像素点,不是文字。Turnitin的算法根本不认识“这张图和那张图长得像不像”这件事。
你可以这么理解:Turnitin像一个只会读文字的书呆子,你给它看一张照片,它什么都看不懂,只会跳过。
这也是为什么Turnitin对提交的文件有严格的要求——文件里必须包含“可高亮选择的文本” 。如果你的PDF是一张扫描图(里面全是图片,没有可选文字),Turnitin根本不会接受。有些学生把纸质书扫描成PDF提交,结果系统直接报错——就是因为Turnitin读不出里面的文字。
三、那图片里的文字能被查到吗?
这是另一个常见的误区。
有些学生听说“Turnitin不查图片”之后,会问:“那我图片里写的文字呢?比如截了一张网页的图,图里面有文字,Turnitin能读到吗?”
答案是:看情况。
如果你的图片是直接插入Word或PDF里的图片(比如截图、照片),Turnitin读不到里面的文字。因为对Turnitin来说,那就是一张图片,它不会去“识别”图片里写了什么字。
但有一种例外:如果你的图片是扫描件,而且文件本身带有OCR(光学字符识别)文字层——也就是说,虽然你看上去是一张图,但背后其实藏着可以被选中的文字——那Turnitin可能会读到这些文字。不过这种情况比较少见,而且准确性也不高。
更常见的情况是:很多人把网页上的内容截图粘贴到论文里,以为这样就不会被查重。这个想法是错的——截图里的文字Turnitin确实读不到,但你截图旁边写的文字、你对截图的描述文字,Turnitin全都会查。如果你的描述文字和别人写的高度相似,照样会被标出来。
所以,不要以为“把文字做成图片就能逃避查重” ——这不靠谱,而且本身就是学术不端行为。
四、一个容易被忽略的问题:图片会影响文件上传
虽然Turnitin不查图片内容,但图片太多可能会影响文件上传。
Turnitin对提交文件有一些基本要求:文件小于100MB,少于800页,纯文字内容至少20个词以上。
如果你的论文里放了大量高分辨率图片,文件体积很容易超过100MB,导致上传失败。
另外,包含大量矢量图片(比如AI格式的图)的文件可能会处理失败或耗时过长。
所以,如果你只是交课程作业,图片本身不会被查重,但太多太大的图可能会让你连提交都提交不上去。
五、那SCI论文的图片怎么查重?
这是很多准备投稿的科研人员真正关心的问题。
Turnitin不查图片,它的“兄弟”iThenticate同样不查图片。普渡大学的官方说明写得明明白白:“iThenticate工具不检测图片中的问题(造假、篡改、重复使用、AI生成图片)” 。
但问题是,SCI期刊现在查图片查得比查文字还严。
前面我写过一篇关于ImageTwin的教程,里面提到过:2023年美国微生物学会在2627篇已被接收的稿件中用ImageTwin筛查,结果在3.9%的稿件里发现了图片重复问题,最终有6篇因为问题无法解决而被撤销了接收决定。
那图片到底应该怎么查?目前主流的专业图片查重工具有两个:
1. Proofig AI
Proofig和Turnitin其实是一家人——Proofig是Turnitin旗下的图片查重工具。2025年,Turnitin和Proofig联合推出了PubShield系统,把Turnitin的文字查重和Proofig的图片查重整合到了一个工作流里。
Proofig能自动检测科研图片中的重复、篡改和不一致,覆盖Western Blot、显微镜图像、体内体外实验图像等。
2. ImageTwin
ImageTwin是另一款主流的图片查重工具,被全球8成以上的大型学术出版商使用,包括Wiley、Elsevier等。它的数据库里有超过1.5亿张已发表论文的图片,能识别经过裁剪、旋转、调色、镜像翻转的重复图片。
六、一张表总结:不同场景怎么处理图片
你的场景 | Turnitin能查图片吗? | 应该怎么做? |
|---|---|---|
交课程作业/毕业论文 | 不能 | 不用担心图片导致相似率虚高;但要注意图片引用规范 |
投SCI/SSCI期刊 | 不能(iThenticate也不能) | 投稿前用Proofig或ImageTwin自查图片 |
PDF是扫描图片(无可选文字) | 系统根本不会接受 | 必须转换成含可选文字的PDF |
图片里包含文字 | 通常读不到 | 不要试图用截图逃避文字查重 |
论文里图片太多太大 | 可能上传失败 | 压缩图片,确保文件小于100MB |
七、给不同读者的三条建议
如果你是交课程作业或毕业论文的学生:
不用担心图片本身被Turnitin查到。你真正需要关注的是文字部分——正文、引用、参考文献这些。图片只要规范标注来源即可。但注意,如果你的PDF是扫描件(全是图片没有文字),Turnitin根本不会接受,一定要确保文件里有可选择的文字。
如果你是准备投SCI的研究人员:
Turnitin和iThenticate都帮不了你查图片。投稿前一定要用专门的图片查重工具自查一遍。Proofig和ImageTwin二选一,别省这个钱。图片问题被期刊发现,轻则退回修改,重则直接拒稿甚至影响学术声誉。
如果你是想“用图片逃避查重”的人:
趁早打消这个念头。第一,Turnitin虽然不查图片内容,但你的文字部分照样会被查;第二,就算Turnitin没发现,你的导师、审稿人用肉眼也能看出来不对劲;第三,现在期刊都有专门的图片查重工具,你逃得过初一逃不过十五。
回到最初的问题:Turnitin能查图片重复率吗?
答案非常明确——不能。 Turnitin是一个文字比对工具,它只查文字,不查图片、不查图表、不查公式。
但这不意味着图片就不需要查重了。对于课程作业,图片主要靠你自己和导师把关;对于SCI投稿,图片必须用专门的工具(Proofig或ImageTwin)自查。
文字查重找Turnitin,图片查重找Proofig或ImageTwin——各司其职,别搞混了。