论文P图等于造假?图像处理你踩过多少“雷”

 作者:胡珉琦 来源:中国科学报微信公众号 发布时间:2022/6/15 9:05:27 

  近年来,图片造假可谓是最易发生学术不端行为的重灾区,因此导致的撤稿风波一浪高过一浪。 

  针对目前覆盖范围最广的撤稿观察网站(Retraction Watch)的案例分析显示,截至2021年1月20日,以图表为主的数据学术不端问题高居论文被撤销的原因之首。 

  而中国科学技术信息研究所对2007~2017年论文发表量超过20万篇的国别论文数的统计显示,中国因图片问题的“撤稿发文比”仅次于印度和美国。 

  究竟什么样的图像处理算学术造假?二者之间的界限在哪里?除了部分“别有用心”的作者,许多科研人员是因为无法清晰地知晓图片处理规范,一不小心越过了“红线”。 

  复制拼图、重复使用、过度修饰是常见行为 

  目前,根据国际上对科研与出版中的学术不端的分类,学术界一般将图片学术不端行为归为伪造、篡改、剽窃这3大类型。 

  伪造是指伪造实验数据、编造虚假研究成果,从而得到不真实的图像;篡改是指在真实的图片基础上进行人为修改、剪切、拼接内容等而未予明显标示,破坏了原始数据的完整性;剽窃则是在论文中直接复制他人或自己已发表成果中的图片,未指明出处或缺少版权许可,包括整图复制后重复使用以及调整图片样式后使用等。 

  中国科学院空天信息创新研究院(以下简称“空天院”)《中国图象图形学报》编辑部曾对杂志的审稿人展开过科技论文中图片造假和学术不端情况的专项调研,这些审稿人都是具有5年以上审稿经验、科研一线的计算机应用领域的学者。 

  “有近八成的专家表示自己在中英文期刊的审稿过程中发现过图表学术不端问题。”空天院学会与期刊部主任闫珺告诉《中国科学报》,其中伪造图像、使用重复图像、篡改图像、剽窃图像的比例分别为45.95%、40.54%、37.84%、32.43%。 

  而在问题图片中,“伪造性能评价结果等图像”“调色后重复使用”和“反复实验,人为挑选最优结果”“复制拼图”是常见的几种类型。 

  《浙江大学学报(英文版)》副编审叶青承担了国内多项关于图片中学术不端行为和如何防范的研究。他在帮助期刊进行图片审读的过程中所发现的图片造假案例,主要有电泳条带拼接、图片拼接、图片重复使用、背景过度修饰等。 

  在研究过程中,叶青发现,许多科研人员是因为对正确处理图片的规范以及图片学术不端的判断标准缺乏应有的了解,才不慎踩了造假的“雷”。 

  P图等于造假? 

  P图是科研人员对图像处理工具Photoshop等的简称,以 Photoshop 为代表的一大批图像处理软件被广泛应用于众多领域,的确为少数别有用心、投机取巧的论文作者提供了功能强大的“造假”工具,但P图并不等同于图片造假。 

  在闫珺看来,某些领域或科研实验中,一定程度的图像处理不可避免,尤其是为了使研究成果更加清晰直观,作者对图像进行合理规范的处理是允许的。 

  比如,对图片进行去噪声,使用荧光显微照片增强特定效果等操作。 

  “这些对图片的亮度、对比度或色彩平衡进行整体的调整,只要不隐藏、消除或歪曲原图的信息,并不属于学术不端的范畴。”闫珺解释。 

  “判断图片是否造假的关键,是图片中是否存在歪曲事实的问题。”她强调,“如果作者对图片的局部区域进行了复制、粘贴、增强、形变、模糊、位移、旋转、裁切、删除、添加新要素等篡改操纵行为,这样的P图就是造假。” 

  叶青认为,判定图片是否造假非常复杂,特别是伪造和篡改,需要结合具体的实验数据、修改处理、结果表达等内容进行综合判断。 

  国际上对于图片问题有明确的分级标准。叶青在《英文科技期刊论文图片学术不端审读方法探索与思考》一文中提到,根据主观上是否存在造假的意图以及客观上处理后的图片是否改变图片内容的展示,破坏图片的完整性;是否影响实验图片的结论;能否提供原始数据;能否重现图片处理的过程,我们可以把图片不当处理的行为分成4个级别。 

  第一种是图片存在不当处理。比如,不经说明,将对照组重复使用,或者同一图片在不同结果中展示,尽管是在同一条件下完成,但缺少说明。 

  这类情况情节较轻,一般不会改变结果或对结果造成误导。 

  其次,是图片存在部分修饰或错误,比如美化图片背景,导致部分图片信息缺失,或者删除中间无关泳道后对电泳条带进行拼接合成导致图片完整性被破坏。 

  但从结果看,研究结论未发生改变。 

  出现这两类情况,只要作者能提供原始数据的支持,给出令人满意的解释,即便论文已经发表,一般进行勘误就可以纠正错误。 

  第三种是图片存在过度修饰,比如图片特定区域被增强或减弱,导致部分图片信息缺失,或者调整图片亮度和对比度,导致定量实验结果产生偏差,而且作者未明确说明具体的修改,导致图片完整性被破坏,研究结论发生改变。 

  这时,作者就会面临被撤稿的风险。 

  最后则是图片存在严重的伪造和篡改,包括拼接、拷贝、插入和选择性删除等,比如图片由不同实验条件下的多个图片拼接而成,并作为新的实验结果,或者同一图片在不同实验条件下重复使用,且作者无法提供原始数据或所提供的原始数据不可信。 

  达到这一程度,则会被认为存在严重学术不端行为。 

  图片分析师让造假无所遁形 

  国际上大部分的英文科技期刊对于论文中图片相关的学术不端行为的检测,目前主要依赖于评审专家和同行学者的发现和举报。 

  “同行评议是一种非常成功的质量保证机制,但它并不足以防范异常的图片。” 叶青坦言,“而一些新研发的图片剽窃检测软件还处于研发和试用阶段,误报率和灵敏度无法兼得。” 

  因此,国外有不少期刊针对图片问题在编辑部初审阶段专门增加了图片检测的环节,部分优秀生物医学期刊开始实施一种新的图片深度查证流程,并设置专门的审核岗位进行学术图片的审核,比如欧洲分子生物学组织(EMBO)出版社。 

  叶青介绍,这些期刊编辑部对经过同行评议、作者修回的拟接收稿件,在最终决定发表前,会由图片分析师对稿件中的图片进行逐一审查,并采用人工识别加软件分析的方法分析图片。 

  一般而言,对于存在明显的重复、裁剪、涂抹痕迹的图片,可以通过分析师肉眼识别。而对于其他比较隐蔽、复杂的图片,他们会使用Photoshop软件以及美国研究诚信办公室提供的 Droplets工具包,通过调整灰度、色差、滤镜等方法,分析图片中是否存在复制、旋转、翻转、插入、擦除、裁剪、拼接、畸变、背景不连续或其他方式的过度修饰,并进行细节比对。 

  虽然目前设置该流程的国际期刊仍是少数,但未来图片审查会越来越成为期刊审稿环节的重心,而不是等论文发表后再做被动处理。 

  “这也提醒了科研人员,在投稿环节必须严格按照目前国际出版界广泛接受和认可的图片处理规范,特别是几条不能逾越的‘红线’。” 

  叶青再次强调,作者可以对整幅图片进行亮度、对比度或颜色平衡的调整,但这些调整不可以掩盖、消除或歪曲原图中的任何信息;不对图片中的特定区域或某个特征属性单独进行增强、掩盖、移动、删除或添加;不对图片进行过度修饰,比如以牺牲其他区域为代价来强调图像中的一个区域。 

  如果必须对图片进行非线性调整或删除部分信息,就应该在图注或正文中公开所有操作记录;避免将从不同的凝胶、电场、曝光或实验条件下获得的图像放在同一张图中,以及在不同的图片中重复使用相同的图。 

  如果必须这么做,则要在图注或正文中进行文字说明。 

附件: