一个学生拿着两篇查重报告来找我,一脸懵:“老师,我同一篇论文,先用CrossCheck查了一次,15%,然后又用iThenticate查了一次,22%。到底信哪个?”
我问他在哪儿查的,他说:“淘宝上,第一家店说用的是CrossCheck,第二家说用的是iThenticate。”
我一看那两份报告,第一份连参考文献都没排除,第二份的数据库来源全是些乱七八糟的网页。
我跟他说:“你这俩,大概率都不是正版。”

他不信。后来我帮他找了学校的正版iThenticate账号重新查了一遍,18%。跟之前的两个数字都不一样。
这个学生的经历,其实反映了很多人面临的问题:CrossCheck和iThenticate到底是什么关系?该用哪个?去哪儿查才靠谱?
今天我把这两个东西彻底给你讲清楚。
一、先搞清楚它们的关系:不是两个东西,是一家人
很多人以为CrossCheck和iThenticate是两个不同的查重系统,就像微信和QQ一样,各玩各的。
不是的。
我给你捋一下时间线:
最早,有个叫CrossRef的非营利组织,专门做学术资源的链接和共享。后来学术不端越来越严重,2008年,CrossRef联合了一批学术出版机构,推出了一个检测服务,取名CrossCheck。
再后来,Turnitin公司提供了技术支持,用的是他们的iThenticate系统作为CrossCheck的技术引擎。
2016年,Crossref把CrossCheck更名为Similarity Check(相似性检测服务)。
所以现在的情况是:
CrossCheck / Similarity Check:这不是一个独立的查重系统,而是Crossref提供给会员期刊的一项“检测服务”
iThenticate:这才是真正执行文本比对的查重软件
一句话总结:CrossCheck是服务名字,iThenticate是软件名字。你用iThenticate查出来的结果,跟期刊编辑用CrossCheck看到的基本一样。
你打开iThenticate的查重报告,右上角还能看到“CrossRef”的字样,这就是它的“血脉印记”。
二、数据库到底有多大?给你几组硬数据
很多人关心一个问题:“我抄的那些内容,系统能查到吗?”
这取决于数据库有多大。根据iThenticate官方和CrossRef的数据,我整理了以下几组数字:
数据类型 | 数量 | 来源 |
|---|---|---|
已存档和当前的网页 | 540亿+ | CrossRef数据库 |
订阅内容(期刊文章等) | 2.44亿篇 | 800+家顶级学术出版商 |
开放获取文章、书籍、会议论文 | 2亿+ | 各类OA资源 |
主要报纸、期刊、学术著作 | 1.54亿种以上 | 多个内容提供商 |
哪些出版社加入了?包括Elsevier、Springer、Wiley、IEEE、Nature Publishing Group这些顶级出版社,都和Crossref有合作,授权把自己的论文纳入比对数据库。
这意味着:
你抄了Elsevier期刊上的论文 → 能查到
你抄了Springer期刊上的论文 → 能查到
你抄了普通网页上的内容 → 也能查到(540亿网页不是白爬的)
但有一个局限:数据库主要覆盖的是加入CrossRef的期刊。国内有些中文期刊没加入,可能查不到。所以你投国内中文期刊,用知网查更合适。
另外,系统支持检测30多种语言,包括英文、简体中文、繁体中文、日文、韩文等。你写的英文论文、中文论文,都能查。
三、谁在用这两个系统?区别在这儿
虽然技术一样、数据库一样,但在实际使用中,它们的使用对象不一样。
对比项 | CrossCheck(期刊版) | iThenticate(个人版) |
|---|---|---|
主要用户 | 学术期刊、出版社等机构 | 研究人员、学生个人 |
谁在用 | Elsevier、Springer、IEEE等 | 投稿前的作者自查 |
能看到什么 | 整体抄袭率+相似片段 | 整体抄袭率+相似片段+相似度分析+引用格式检查 |
检测范围 | 主要是加入CrossRef的学术文献 | 更广,延伸到互联网学术资源、开放获取论文等 |
简单来说:CrossCheck是期刊用来查你的,iThenticate是你用来查自己的。
你用iThenticate自查,看到的东西跟期刊编辑用CrossCheck看到的基本一样。这就是为什么投稿前一定要用iThenticate自查——你在用跟期刊同样的标准检查自己。
而且iThenticate的功能更全。除了告诉你抄袭率,还会告诉你:
哪些部分跟哪些文献相似
相似程度有多高
引用格式有没有问题

四、一份iThenticate报告,重点看哪几个数字?
很多学生拿到查重报告,只看第一个数字:总重复率。这是最大的误区。
一份完整的iThenticate报告,至少要关注三个指标:
第一个:总相似度(Overall Similarity Index)
就是报告首页右上角那个百分数。拿到的第一眼确实要看它,但别只盯着它。
第二个:单源相似度(每篇来源的匹配比例)
这个比总重复率更关键。
打个比方:总重复率只有10%,看起来挺低。但仔细一看,这10%里有8%都来自同一篇论文。这意味着什么?意味着你这篇论文有8%的内容(可能是整整一段甚至几段)跟某一篇已发表文献几乎一模一样。
期刊编辑看到这种情况,会怎么想?“这8%是抄的吧。”
第三个:重复发生的位置
方法部分有重复,编辑一般能理解,因为实验方法的描述本来就大同小异。
但讨论和结论部分如果出现大面积重复,问题就严重了。因为讨论和结论应该是你原创的思考,这部分如果跟别人一样,说明你的研究可能真的没有独特贡献。

五、查重前,把这几件事设置好
很多人花一两百块钱查了一次,结果不准,因为设置错了。
登录iThenticate后,先去Settings页面调整以下几个选项:
设置1:排除参考文献
在Settings里,找到排除选项,勾选“排除参考文献”(Exclude bibliographic materials)。系统检测到参考文献列表,就会自动排除,不算进重复率。
如果参考文献被算进去了,重复率会虚高。因为参考文献的标题本身就是从别的期刊复制过来的。
设置2:排除引号内的内容
可以设置“排除引号内的匹配”(Exclude quotes)。这样,你规范引用的内容不会被算成重复。
设置3:排除小范围匹配
可以设置忽略低于一定单词数的匹配,比如忽略6个单词以下的匹配。大多数期刊的默认设置是:6个连续单词相同才算重复。如果你自查时发现有很多3-4个单词的匹配,可以暂时忽略。
设置4:选择比对数据库
在“Limit search to these repositories”里,可以勾选你想比对的数据库。一般建议全部勾选:Internet(网页)、Publications(出版物)、Crossref(CrossRef数据库)、Submitted Works(已提交作品库)。
六、去哪里查最靠谱?
这是一个很现实的问题。
如果你学校或课题组买了iThenticate的机构版 → 找导师或图书馆老师帮忙查。很多国外大学都买了这个服务,比如加州理工学院、宾夕法尼亚大学、拉筹伯大学等。这是最靠谱的,不要钱,而且是正版。
如果你学校没有 → 可以找正规的第三方查重平台。但要确认两件事:
用的是正版iThenticate,不是盗版或山寨系统
承诺“不留痕”,不会把你的论文收录进数据库
为什么要确认“不留痕”?因为如果你的论文被收录了,等你正式投稿时,期刊那边一查,会发现你的论文跟数据库里已有的内容匹配——匹配对象就是你自己之前查重时上传的版本。这会被判定为自我抄袭,非常麻烦。
一个避坑建议:淘宝上十几块、几十块的查重服务,最好不要碰。数据库对不对、是不是正版、会不会留痕,你都搞不清楚。省那几十块钱,可能让你多花两个月时间重新投稿。
正版iThenticate个人查一次官方价格是125美元左右,所以那些十几块钱的,你想想就知道靠不靠谱。
七、关于CrossCheck和iThenticate,你只需要记住这几句话
CrossCheck是服务名,iThenticate是软件名。它们本质上是同一个东西。
期刊编辑用CrossCheck查你,你自己投稿前用iThenticate自查。用同样的标准,才能确保结果一致。
iThenticate的数据库覆盖了800+家顶级出版社的2.44亿篇论文,加上540亿网页。你抄了Elsevier、Springer、IEEE的论文,基本都能查到。
查重不只是看总重复率,还要看单源重复率和重复位置。单篇重复率超过3%-5%就要重点修改,讨论和结论部分的重复尤其危险。
查重前设置好排除选项:排除参考文献、排除引号内容、设置匹配单词数。这些设置直接影响查重结果的准确性。
找正规渠道查重:学校机构版最好,正规第三方平台次之,淘宝便宜货最不靠谱。正版iThenticate官方价格125美元,那些几十块钱的不用想都知道问题。
最后的真心话
CrossCheck和iThenticate,说白了就是同一个东西在不同场景下的名字。搞懂它们的区别,不是为了考试,是为了你投稿时不再被坑。
我每年都会遇到学生在查重上栽跟头——用了错的系统、查出了错的数据、投出去被拒、耽误两三个月。这些坑,你提前知道就能绕过去。
记住:花几十块钱、花半天时间,认认真真查一次、改一次,比你被拒了再重投、再等两个月,划算太多了。
如果你现在正准备投稿,可以把你的论文类型告诉我,我帮你看看应该用哪个系统查、怎么设置参数。
关键词
CrossCheck;iThenticate;SCI查重;论文查重系统;查重区别;Similarity Check;CrossRef