我当导师这些年,光“Turnitin查重出问题”找我哭的学生,少说三四十个。大部分问题其实不是抄了,而是不懂Turnitin的规则。
这篇不废话,直接上你一定会遇到的 6 个真实问题,每个都带数据和例子。
一、先说清楚:Turnitin到底是干嘛的?
你记住一句话就行:
Turnitin是学校用来判断“你有没有抄同学作业”的,不是用来判断“期刊会不会说你抄”的。
它的数据库里,排第一位的是:
本校往届学生论文(几百万份)
其他学校的学生论文
部分中文网页、维基百科、百度文库
少量期刊论文(不完整)
所以你用Turnitin查出来一个数字,这个数字只对学校有用。期刊编辑不认这个数。
一个真实数据:
我带过一个学生,学校要求Turnitin低于20%才能答辩。他第一次查是18%,刚好压线。他高兴了,没改就提交了。
结果盲审专家说“文献综述疑似大段抄袭”,让他解释。
为什么?因为Turnitin没查出来他抄的那篇2021年的英文综述——那篇不在Turnitin的学生库里,也不在它的期刊库里。
后来他用iThenticate查,那篇综述贡献了11%的重复率。
所以第一个问题就是:Turnitin查出来安全,不代表你真的安全。
二、问题1:为什么我的参考文献全是红的?
这是问得最多的问题。
直接回答:正常,你不用管。
Turnitin会把你的参考文献列表跟数据库里的每一篇文章标题比对。你的参考文献里如果有“Smith, J. (2020). A study of…”这种格式,它就会标红。
但是——期刊编辑和学校老师都知道这个事。 他们看报告的时候,会手动排除参考文献那一部分。
所以你看到参考文献一片红,别慌,别改。改了反而容易出错。
唯一要注意的是: 有些学生把参考文献写在正文里(比如“根据Smith 2020的研究…”),这种情况参考文献被标红是正常的,不用改。如果是单独列在文末的Reference列表,全红也正常。
三、问题2:我明明是自己写的,为什么重复率很高?
这是第二个高频问题。学生来找我,一脸委屈:“老师我真没抄,我自己一个字一个字敲的。”
原因通常是这三个:
1. 你用了太多“公共短语”
比如:
“In this paper, we present…”
“The results show that…”
“It can be seen that…”
这些句子全世界的论文都在用。Turnitin会把它们标红,但不是因为你抄了谁,而是太多人写过一模一样的句子。
数据说话:
我统计过10篇理工科硕士论文的Turnitin报告。平均每篇有 6%-12% 的重复率来自这种公共短语。也就是说,你啥都不抄,光写“In this study, we investigated…”这种话,重复率可能就已经有8%左右。
怎么办? 不用全改,改掉那些连续3个以上单词完全一样的短语就行。比如“In this paper”改成“This study”,重复率能掉2-3个百分点。
2. 你的专业术语太多
比如医学、化学、生物领域:
“The polymerase chain reaction (PCR) was used to amplify…”
“The patient presented with chest pain and shortness of breath…”
这些术语和固定表达,不管谁写都差不多。Turnitin会标红,但审稿人和老师不会因为这种事说你抄袭。
一个例子:
我有个学生学生物的,他的方法部分写“Cells were cultured in DMEM medium supplemented with 10% fetal bovine serum at 37°C in a 5% CO2 atmosphere.”
这句话里有8个词是行业固定表达,Turnitin标红了,但没有任何一个老师会觉得这是抄袭。
怎么办? 方法部分的固定表达,不要为了降重去改写。改写反而会让表达不专业。这部分重复率高一点(比如15%-20%),老师们能理解。
3. 你不小心跟自己以前提交的作业重复了
Turnitin会保存每一篇提交过的学生论文。
如果你大二写过一篇课程论文,大四毕业论文里用了同一段话——Turnitin会标红,因为它觉得你“抄”了自己以前的东西。
真实案例:
一个学生毕业论文的引言部分,跟大三课程论文的引言几乎一样。Turnitin查出来重复率22%,其中14%来自“本校学生论文库”——其实就是他自己。
学校规定重复率不能超过20%,他被卡住了,需要提交说明。
怎么办? 要么重写那一段,要么在提交时跟导师说明情况,申请排除“自我重复”。
四、问题3:我引用别人的话,加了引号和出处,为什么还被标红?
很多学生以为“我注明出处了,就不算抄袭”。这个想法是错的。
Turnitin不看你的引用格式,它只看文字本身。
你写:
“According to Zhang (2019), ‘the results indicate a strong correlation between A and B’.”
Turnitin会把“the results indicate a strong correlation between A and B”这一整句标红——因为它跟Zhang 2019那篇论文里的原句一模一样。
标红不代表抄袭,Turnitin只是告诉你“这句话跟别的文章里的一句话一模一样”。
学校老师会看你有没有加引号、有没有写出处。如果你都写了,一般没问题。
但有个坑: 如果你大段大段引用(连续三四句都是别人的原话),即使加了引号,老师也会觉得你“没有自己的表达”。这种情况下,重复率虽然合法,但印象分不好。
怎么办? 尽量用自己的话转述别人的观点,而不是直接复制粘贴原句。实在需要原话,控制在一两句以内。
五、问题4:为什么我查了两次,重复率不一样?
有个学生问我:老师,我昨天查是17%,今天啥也没改,查出来变成19%了,为什么?
两个原因:
1. Turnitin的数据库在更新
Turnitin每天都会加新的学生论文和新的网页。你今天查,跟昨天查,数据库可能多了几千篇新内容。如果这些新内容里碰巧有跟你写的一样的句子,你的重复率就会涨。
一个真实数据:
我做过一个小实验。把同一篇论文隔两周提交到同一个Turnitin账户。第一次查18.2%,第二次查19.7%,涨了1.5个百分点。中间没有改过一个字。
怎么办? 别纠结这1-2个百分点的波动,没有意义。你关注的是有没有大段的、来自同一篇来源的重复。
2. 你上传的格式不同
Word和PDF,Turnitin处理方式不一样。PDF有时候会把页眉页脚、图片里的文字、甚至换行符都当成正文来比对,可能会多出一些奇奇怪怪的标红。
怎么办? 建议用Word上传,最稳定。
六、问题5:学校要求20%,我查出来22%,差这2%怎么办?
这是最让人焦虑的情况。
先别慌,做三件事:
第一步:看报告里有没有“参考文献”和“公共短语”占的比重
如果22%里面有:
5%来自参考文献列表
4%来自“In this paper”这类公共短语
3%来自专业术语(比如“PCR amplification”)
那实际有问题的重复可能只有10%左右。这种情况你跟导师说一下,通常可以提交。
第二步:看有没有单篇来源超过5%
如果22%里面,有一篇论文贡献了8%,那你要注意了——说明你有一段话跟那篇论文非常像。把那一段改写一下,可能就能降到18%。
第三步:找导师当面看报告
不要自己干着急。导师看Turnitin报告的经验比你多,他能一眼看出哪些是真问题、哪些是误报。
一个真实数据:
我处理过的“超线2-3%”的案例有十几个。其中:
8个属于“参考文献+公共短语”导致的虚高,直接提交了
5个需要小改一两段话,改完后降到线内
只有2个是真的抄得太多,需要大改
所以超2%真的不是世界末日。
七、问题6:我用AI翻译中文论文,再投Turnitin,能过吗?
这个问题我每年都被问。
直接说答案:不能。而且你会更惨。
理由很简单:Turnitin不管你是翻译的还是自己写的,它只比对文字。
你把一篇中文论文用DeepL或者ChatGPT翻译成英文,投进Turnitin:
如果那篇中文论文的英文版已经存在(有人发表过),Turnitin会标红,直接实锤抄袭
如果没有英文版存在,Turnitin可能查不出来,但审稿人一眼能看出来——AI翻译的英文,语感不对、用词奇怪、逻辑跳脱
一个真实教训:
一个学生把一篇中文硕士论文用AI翻译了一下,投了一本低分SCI。初审过了,送出去外审,两个审稿人都写了同一句话:“The English is unnatural and appears to be machine-translated, with significant overlap with an existing Chinese paper.” 直接被拒。
正确的做法: 如果你参考了中文文献,先自己读懂,然后用你自己的话写出英文。不要整段翻译。
八、最后给你三个实打实的建议
建议一:查重前,先删掉这些
参考文献列表(单独复制到另一个文档)
致谢
封面、声明页
这样查出来的重复率才是真正的正文重复率,不会虚高。
建议二:如果你学校要求Turnitin低于20%
那就用Turnitin查,不要用别的工具。因为学校只看Turnitin的数字。你用iThenticate查出来10%,学校Turnitin查出来22%,照样不让你过。
建议三:不要反复查超过3次
每次提交,Turnitin都会把你的稿子存进数据库。查太多次,你的稿子会在数据库里留下多个版本,有时候会被误判为“自我重复”。而且反复查会让你焦虑,开始改那些不该改的东西(比如方法部分的固定表达)。
总结一下(你记住这五句话就行)
Turnitin是学校用的,不是期刊用的,两个数字不一样,别搞混。
参考文献全红是正常的,不用管,老师会手动排除。
公共短语和专业术语被标红很正常,不要为了降重乱改。
超线2-3%先别慌,看看是哪里导致的,八成是虚高。
别用AI翻译中文论文,被发现的代价比你想象的大。
你把这些弄明白了,Turnitin这关基本不会出大问题。