一个学生,准备投一篇二区SCI。投稿前他在淘宝上找了个查重,店家说“我们用的是Turnitin,跟iThenticate一样”。他信了,查出来重复率12%,直接投了。
一周后退稿。编辑说重复率27%,超过期刊红线。
他懵了,跑来问我。我帮他找了学校的正版iThenticate重新查了一遍——26.8%。
那个淘宝店用的是Turnitin的学生版,数据库偏重学生论文,跟iThenticate的期刊论文库根本不是一回事。

这个学生的经历,其实反映了很多人面临的问题:投SCI到底该用什么查?iThenticate合适吗?
今天我把这件事彻底讲清楚。
一、先说结论:iThenticate就是为SCI投稿量身定做的
全球超过1500家学术出版机构使用iThenticate审查稿件。
这些出版社包括:Elsevier、Springer、IEEE、Wiley、Taylor & Francis、ACS、Sage Publications……基本上你能叫得出名字的顶级出版社,全在用。
我查到一个很直观的数据:全球约三分之一的学术期刊使用iThenticate。这意味着你投SCI期刊,大概率会被iThenticate查。投稿前用它自查,等于跟期刊用同一把尺子。
哈尔滨工业大学图书馆的官方介绍里直接说:iThenticate是“全球最权威的论文原创性检测工具”,国际主要出版机构和大部分SCI期刊都使用它审查稿件。
二、它的数据库有多大?够不够用?
这是核心问题。iThenticate的数据库覆盖了以下几块:
数据库类型 | 包含内容 | 数据量 |
|---|---|---|
订阅内容 | 顶级出版社的期刊文章 | 1.78亿+篇 |
开放获取 | 开源期刊、会议论文、预印本 | 1.35亿+篇 |
互联网 | 当前和存档网页 | 700亿+页 |
ProQuest | 学位论文库 | 数百万篇 |
PubMed/MedLine、EBSCO、McGraw-Hill这些数据库也在里面。
这意味着什么?你抄了Elsevier期刊上的论文→能查到;抄了某个预印本→能查到;抄了开放获取文章→也能查到。你投SCI期刊会遇到的重复来源,iThenticate基本都覆盖了。
有一个数据值得留意:iThenticate覆盖了约93%的热门期刊文章。也就是说,你平时读的那些顶刊论文,绝大部分都在它的数据库里。
三、SCI期刊查重的“黄金标准”:有研究数据支撑
iThenticate不仅是“用得多”,而且是“公认准”。
有一项发表在PubMed上的研究,专门验证了iThenticate的准确性。研究者让专家手工标记了399篇论文(作为“金标准”),然后跟iThenticate的查重结果对比。
结果是这样的:
指标 | 数据 |
|---|---|
敏感度(能正确找出有问题的论文) | 84.8% |
特异度(能正确判断没问题的论文) | 80.5% |
最优分数线 | 15% |
敏感度84.8%的意思是:100篇专家认定有抄袭问题的论文,iThenticate能找出约85篇。特异度80.5%的意思是:100篇专家认定没问题的论文,iThenticate正确判断约80篇没问题。
这项研究给出的结论是:iThenticate相似度15%是最优分数线。这也跟很多期刊的实际要求吻合。
四、SCI期刊的具体查重要求是多少?
不同期刊要求不一样,我给你几个参考:
Frontiers出版社(知名开放获取出版商,旗下有很多SCI期刊):官方在网站上明确说“我们用iThenticate扫描每一篇投稿”,建议重复率控制在20%以内,单篇重复率控制在3%以内。投一区或顶刊的话,建议15%以内,单篇2%以内。
一般SCI期刊:多数要求总重复率低于20%,有些更严格的低于15%。部分期刊如果单篇重复率超过5%,即使总重复率不高也可能被判定有问题。
意得辑(Editage) 把iThenticate称为国际期刊的“黄金标准”。这个叫法在学术出版圈很常见。
这跟前面那项研究给出的“15%最优分数线”基本吻合。

五、iThenticate vs 其他查重系统:区别在哪?
对比项 | iThenticate | Turnitin(学生版) | Ouriginal |
|---|---|---|---|
主要用户 | 学术期刊、出版社 | 高校、学生 | 高校 |
数据库偏重 | 期刊论文、会议论文 | 学生论文、网页 | 混合 |
SCI期刊用吗 | 是(主流) | 否 | 否 |
适用场景 | SCI投稿前自查 | 毕业论文自查 | 课程作业 |
有一篇学术论文同时对比了iThenticate和Ouriginal两个系统,检测了16篇稿件。结果很有意思——iThenticate的匹配来源数量少,但每个来源匹配更集中。比如一篇稿子,iThenticate显示匹配来源2个、重复词63个(6%),Ouriginal显示匹配来源1个、重复词22个(2%)。
核心结论:不同系统数据库不同,结果也会不同。你想知道期刊那边怎么判,就得用期刊用的那个系统。
六、投稿前自查的几个硬性建议
建议1:用跟投稿一模一样的版本查
不要删参考文献,不要删作者信息,不要删声明。期刊不会帮你删了再查,你用删减版查出来的结果会偏低。
建议2:投稿前1-2周进行最终查重
留足降重时间。如果多轮修改后新增了内容,建议再查一次。
建议3:不只是看总重复率,还要看单篇
总重复率15%看起来安全,但如果有一篇文献跟你重复了8%,那8%可能是整段照搬。期刊编辑也会看这个。
建议4:自己抄自己也要改
你以前发表的会议论文、期刊论文,直接复制过来也会被标红。这叫“自我抄袭”。
建议5:引用不是护身符
即使加了引号和引用标注,直接复制别人的句子照样算重复。正确的做法是:总结归纳多篇文献的内容,用自己的话重新表述,然后加引用。
最后的真心话
iThenticate查SCI投稿的论文合适吗?
合适,而且是最合适的。
因为SCI期刊审稿用的就是它。你想知道自己的论文在编辑眼里是什么样的,就用同一把尺子量自己。
别再被淘宝上几十块钱的Turnitin学生版骗了。数据库不对,结果差一倍,被拒了才后悔。
省那几十块钱,可能让你多花两个月重新投。
关键词
iThenticate;SCI查重;期刊投稿;查重系统;CrossCheck;论文查重