今天聊一个让很多同学紧张的问题:投稿SCI的时候,要不要把原始数据交上去?
很多学生第一次投稿,看到系统里有个“上传原始数据”的选项,心里就开始打鼓:我没有把所有原始数据打包啊怎么办?会不会被拒?要不要现在开始整理?
别慌。今天咱们把这问题掰开揉碎讲清楚。
一、先说结论:不是所有期刊都要,但趋势是“越来越要”
这事儿没有一个统一的答案。
根据我这些年的经验,大约分三种情况:
情况 | 什么意思 | 常见于 |
|---|---|---|
强制要求 | 必须交,不交不给发 | Nature、Cell、Lancet等顶刊 |
鼓励共享 | 建议交,交了可能加分 | 爱思唯尔旗下大部分期刊 |
按需提供 | 平时不查,审稿人要的时候你得能拿出来 | 普通SCI期刊 |
重点来了: 就算期刊不强制要求,如果审稿人对你的数据有疑问,也可以要求你提供原始数据。你给不出来,轻则退稿,重则被怀疑造假。
二、一组数据让你看清趋势
2023年Cell出版社的调查显示:61%的撤稿事件源于数据完整性问题。
什么意思?就是说,每100篇被撤稿的论文里,有61篇是因为数据出问题了——而这些问题,很多是原始数据能证明“我不是故意的”。
再看看期刊这边:
Nature:明确要求所有声称可重复的实验必须上传原始数据集
PLOS ONE:要求作者提供原始数据,认为共享数据可以提高文章引用
《科研管理》(国内核心):2026年起,不交原始数据直接退稿
超过85%的高分期刊现在要求上传原始数据到公共平台。
趋势很明显:数据共享正在从“可选”变成“必选”。
三、如果要求交数据,具体要交什么?
很多同学一听说“交原始数据”,就觉得要把整个硬盘打包发过去。不是的。
期刊要的是这些:
第一类:原始图片
未经任何修饰的显微镜照片
未经裁剪的Western Blot整张膜
原始的电泳图
第二类:原始数据文件
Excel格式的实验读数
SPSS等统计软件的原始输出
仪器直接导出的数据
第三类:代码和脚本(如果是做计算、算法相关的)
分析代码
数据处理脚本
软件版本和环境信息
注意: 期刊一般不要你实验室手写的记录本扫描件,也不要好几个GB的原始视频。他们要的是“能支撑论文结论的核心数据”。
四、数据怎么交?不是直接传附件
大多数人可能不知道:期刊一般不让你直接把数据作为附件上传。
而是要求你先把数据传到公共数据仓库,拿到一个号码(DOI号),然后在论文里写上这个号码。
常见的公共数据仓库有这些:
仓库名称 | 适合什么数据 | 特点 |
|---|---|---|
Figshare | 综合类数据 | 通用性强,好上手 |
Zenodo | 综合类数据 | CERN出品,免费 |
Dryad | 生命科学数据 | 很多生物医学期刊推荐 |
NCBI | 基因/测序数据 | 生物信息学必用 |
Figcheck | 图片查重 | 国产,免费但有次数限制 |
操作方法也很简单:
去对应平台注册账号
上传你的数据文件
平台会生成一个DOI号(类似于数据的身份证号)
把这个DOI号写进论文的“数据可用性声明”里
投稿时在系统里填上这个号码
五、“数据可用性声明”是什么?怎么写?
这是近两年越来越多期刊要求的东西。简单说,就是在论文末尾、参考文献之前,写一段话说明你的数据在哪里、怎么获取。
综述类文章(没产生新数据)可以这样写:
Data sharing not applicable to this article as no datasets were generated or analysed during the current study.
数据存在公共仓库的可以这样写:
The datasets generated during and/or analysed during the current study are available in the [repository name] repository, [DOI number].
数据因隐私问题不能公开的可以这样写:
The data that support the findings of this study are available from [third party name] but restrictions apply to the availability of these data, which were used under license for the current study, and so are not publicly available. Data are however available from the authors upon reasonable request and with permission of [third party name].
说白了就一句话:告诉读者你的数据在哪、能不能拿到。
六、最让人纠结的几种情况(逐个说)
情况1:我要投的期刊没说要不要数据,怎么办?
去官网找“作者指南”或“投稿须知”,搜关键词“data”“supplementary”。如果实在找不到,默认按“需要”准备——把原始数据整理好存着,不亏。
情况2:我的数据涉及患者隐私,不能公开怎么办?
这不是问题。在数据可用性声明里明确说明原因就行,比如“数据包含可识别个人身份的信息,因此不能公开”。期刊理解这种情况。
情况3:我实验做了3次,每次数据都差不多,只放一次的行不行?
看期刊要求。大多数期刊要求WB条带重复3次,但只要求提交一次的代表性结果。如果不确定,多放总比少放好。
情况4:我刚投出去,编辑就问我要原始数据,但我还没整理好怎么办?
尽快整理。如果实在缺某些数据,诚实说明,同时补实验。期刊给修改机会的时候,就是你补救的时候。
七、一个真实案例
学生小张,做生物医学的,投了一个5分的期刊。投稿时期刊没强制要求交原始数据,他就没交。
审稿意见回来了,其中一条写着:“请提供图3A Western Blot的原始未裁剪膜图像。”
小张慌了,因为他的原始文件命名混乱,找了半天才找到。而且他发现,自己为了排版漂亮,把膜裁得太小了,边缘的marker都裁掉了。
我让他做三件事:
找到原始的、未裁剪的扫描文件
重新导出,这次保留marker和背景
在回复信里说明:原始数据可以提供,之前的裁剪仅出于排版考虑,不影响结果判断
最后文章接收了。但如果他当时根本没保存原始文件,或者原始文件已经丢了,后果就是直接退稿。
八、你现在就该做的事(不管投不投稿)
从现在开始,每个实验做完就整理数据,当天命名、当天备份
原始图片永远保留一份未处理的版本,处理过的另存为新文件
用Excel建一个索引表,记录每个数据文件对应论文里的哪个图
投稿前,把目标期刊的数据政策看一遍,提前准备
养成这四个习惯,以后不管期刊要什么数据,你都能3分钟内找出来。
九、最后说几句大实话
不用怕“交数据”这件事。 对于99%的认真做实验的同学来说,数据都在,只是没整理。花半天时间整理好,以后一劳永逸。
最怕的不是期刊要数据,而是要的时候你拿不出来。 拿不出来,哪怕你是清白的,也说不清楚。
数据共享是大趋势。 2025年了,开放科学是主流。早点适应这个规则,比被动应付要好得多。
如果实在不想交数据,可以选那些不强制要求的期刊。 但注意:审稿人随时可能找你要。所以不管投哪个期刊,原始数据都得好好存着。
关键词:
SCI投稿、原始数据、数据可用性声明、学术不端、公共数据仓库、Figshare、科研诚信、撤稿原因