关键词: iThenticate;SCI查重;论文查重系统;Turnitin;查重报告解读;学术投稿
一、iThenticate到底是什么?
很多第一次投SCI的人,听到“查重”两个字第一反应就是:用知网啊,或者用Turnitin啊。但这两个其实都不对。
iThenticate是美国Turnitin公司开发的一款专门给学术论文用的查重工具。注意,它跟Turnitin是同一个公司做的,但用途完全不一样——这个后面会详细说。
目前全球有1500多家学术出版机构在用iThenticate审查稿件,包括你耳熟能详的Elsevier、Springer、Nature、IEEE、Wiley这些大出版社。换句话说,你投的SCI期刊,大概率就是用iThenticate来查你的论文。
那它到底干什么用?简单说就是:把你写好的论文跟它数据库里海量的已发表文献做对比,找出哪些地方跟别人写的一样或高度相似。然后生成一份报告,告诉编辑:你这篇论文跟已有文献有多少是重复的、重复在哪里、跟谁重复了。
它不是来判定你是不是“抄袭”的——它只负责“找出来”,至于算不算抄袭、要不要拒稿,那是编辑的事。
iThenticate官网查重地址:
https://www.58sci.com/ithenticate/index.html
二、iThenticate的数据库到底有多大?
很多人不理解为什么一定要用iThenticate,不用行不行。答案是:不行,因为它的数据库太大了,别的系统比不了。
我直接给你几个数字:
网页内容: 超过200亿条网页内容,有的说法是470亿甚至700亿——不管哪个数字,都说明一件事:你在网上能找到的公开内容,它基本都能抓到。
订阅文献: 2.44亿篇订阅文献,覆盖97%的高被引期刊。
学术出版商: 来自1500多家顶尖学术出版机构的文献授权,包括你投论文时会遇到的所有大出版社。
期刊覆盖率: 能比对95% 的全球Top 10000高被引期刊的内容。
这些数字什么意思?意思就是:你论文里任何一个句子,只要跟全球任何一本已发表的期刊文章、任何一篇会议论文、任何一个网页内容有重复,iThenticate大概率都能把它揪出来。
对比一下你就明白了:知网的数据库主要收的是中文期刊和学位论文,英文文献覆盖面远远不够。你用知网查一篇英文SCI论文,查出来重复率可能只有5%,但用iThenticate一查,可能直接飙到25%——不是你的论文突然变“抄”了,是知网压根没看到那些英文文献。
所以,投稿SCI,必须用iThenticate查,用别的系统查出来的数字没有参考价值。
三、iThenticate和Turnitin到底有什么区别?
这个问题我被问过太多次了。很多人一看:都是Turnitin公司出的,长得也差不多,那用哪个不一样?
完全不一样。
我打个比方你就懂了:Turnitin是给课堂用的“作业检查器”,iThenticate是给出版界用的“学术安检门”。
具体区别在哪儿?
第一,数据库不一样。 Turnitin的数据库里主要是学生论文和网页内容——它很擅长查学生作业有没有抄同学的。但iThenticate的数据库里全是已发表的学术论文、期刊文章、会议论文、书籍——它查的是你的论文有没有跟已发表的研究重复。你想想,SCI期刊编辑关心的是“你这篇论文跟已发表文献重复了多少”,而不是“跟某个学生的作业重复了多少”——所以期刊用的是iThenticate,不是Turnitin。
第二,你的论文会不会被“记住”不一样。 这是很多科研人最担心的。你用Turnitin查重,你的论文有可能会被加入到Turnitin的学生论文数据库里——这意味着以后别人再查的时候,你的论文就成了“被比对的对象”。但iThenticate默认不会把用户上传的稿件加入比对库,出版社查完就销毁记录,保护你的科研成果不被泄露。
所以,投稿前查重,一定要用iThenticate,别用Turnitin。 用错了不仅查不准,还可能把你的论文存进别人的数据库里。
四、怎么才能用上iThenticate?
iThenticate不像知网那样谁都能注册个账号就用。它采用的是机构授权模式。目前国内用户主要有三种方式:
第一种:通过你所在的高校或研究所。 很多高校都买了iThenticate的机构账号,比如中科院某研究所就开通了iThenticate检测系统。全球Top200高校中有89% 已经采购了机构账号。你可以问问学校图书馆或者科研处,看有没有这个服务。
第二种:通过第三方科研服务机构代查。 比如AJE跟Turnitin有官方合作,提供iThenticate查重服务,单篇142.39元。而如果你自己去iThenticate官网买单篇,价格是125美元(折合人民币900多块)——通过第三方渠道便宜很多。
第三种:期刊编辑部特别授权。 有些期刊在审稿过程中会给你提供查重机会,但这个不常见。
特别提醒: 2023年之后,iThenticate的个人邮箱注册功能已经关闭了。如果你在网上看到什么“个人注册iThenticate”的教程,大概率是过时的信息。
五、查重报告到底怎么看?
拿到查重报告之后,很多人就盯着最上面那个百分比看——高了就慌,低了就开心。但只看百分比远远不够。
我给你拆解一下一份iThenticate查重报告到底该怎么看:
第一步:看总相似率(Overall Similarity)
这就是报告最上面那个百分比。不同期刊对这个数字的要求不一样,有的要求低于15%,有的低于20%。但记住:这只是一个参考数字,不是唯一的判断标准。
第二步:看主要来源(Top Sources)
这部分比总相似率重要得多。它会告诉你:你的论文跟哪几篇文献重复最多、各重复了多少。
如果你的重复主要集中在某一两篇文献上,哪怕总相似率只有12%,也很危险——因为这看起来像是你大段抄了某一篇文章。但如果重复是分散在十几二十篇文献里的,每篇只重复了零点几个百分点,那更像是正常的学术引用。
第三步:看标颜色的内容
报告会把重复的内容用不同颜色高亮标出来。不同颜色代表不同的重复来源——可能是网页、可能是期刊文章、可能是会议论文。
系统默认连续6个以上单词相同就算重复。所以你会发现,连“the purpose of this study is”这种常见的学术套话都可能被标出来——这种不用太担心,属于正常重合。
你需要重点看的是:大段的、连续的内容被标红,尤其是来自某篇已发表期刊文章的——这种必须处理。
第四步:判断重复的性质
不是所有重复都要改。你要区分三种情况:
合理引用且标注规范:比如你引用了别人的一句话,加了引号、标了出处——这种重复是正常的。
通用学术表达:比如“PCR was performed according to the manufacturer's instructions”——这种实验方法的常规表述,很多论文都这么写,重复了也不奇怪。
需要改写的重复:大段文字跟某篇已发表文献高度相似,但没有合理引用理由——这种必须改写。
六、几个必须知道的事
第一,别把参考文献列表也拿去查。 参考文献部分全是别人的文章标题和作者名字,查出来重复率肯定高。提交查重前,把参考文献、致谢、目录这些非正文内容去掉。
第二,别卡着截稿日期才查。 建议投稿前1-2周做最终查重。万一重复率高了,你还有时间改。改完如果新增了不少内容,建议再查一次。
第三,自己抄自己也算重复。 很多人以为“我抄自己以前发的论文不算抄袭”——算的,这叫“自我抄袭”。iThenticate一样会把你以前发表的内容标出来。
第四,查重不是目的,提升论文质量才是。 别为了把重复率降下来,把好好的句子改得面目全非。iThenticate查出来的重复内容,很多时候反映的是你的写作习惯问题——比如过度依赖某篇文献的表述、文献综述写得像文献罗列、方法部分照搬了别人的描述。改这些,本质上是在提升你论文的原创性和可读性,不只是 chasing 一个数字。
最后说几句
我带过的学生里,至少有一半人在第一次投SCI之前根本不知道iThenticate是什么。他们用知网查完觉得没问题就投了,结果被编辑秒拒,理由是“相似度过高”。
其实这个问题完全可以避免。花100多块钱,提前用iThenticate自查一遍,把问题在投稿前解决掉——这比你被拒了再改、再投、再等,省下的时间和精力多得多。
iThenticate不是什么神秘的东西,就是一个工具。你搞懂了它怎么用、报告怎么看,它就帮你保驾护航;你不懂它,它就在你不知道的时候给你挖坑。
希望这篇文章能帮你少走弯路。祝各位投稿顺利!