看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向强后处理场景的图像篡改定位模型 收藏
面向强后处理场景的图像篡改定位模型

面向强后处理场景的图像篡改定位模型

作     者:谭舜泉 廖桂樱 彭荣煊 黄继武 TAN Shunquan;LIAO Guiying;PENG Rongxuan;HUANG Jiwu

作者机构:深圳大学计算机与软件学院广东深圳518060 深圳市媒体信息内容安全重点实验室广东深圳518060 广东省智能信息处理实验室广东深圳518060 深圳大学电子与信息工程学院广东深圳518060 深圳北理莫斯科大学工程系智能感知与计算广东省重点实验室广东深圳518116 

基  金:国家自然科学基金资助项目(No.62272314,No.U23B2022) 广东省重点实验室基金资助项目(No.2023-B1212060076) 

出 版 物:《通信学报》 (Journal on Communications)

年 卷 期:2024年第45卷第4期

页      码:146-159页

摘      要:针对微信、微博等社交平台对图像进行的压缩、尺度拉伸等有损操作带来的篡改痕迹模糊或被破坏的挑战,提出了一种对抗强后处理的图像篡改定位模型。该模型选用了基于Transformer的金字塔视觉转换器作为编码器,用于提取图像的篡改特征。同时,设计了一个类UNet结构的端到端编码器-解码器架构。金字塔视觉转换器的金字塔结构和注意力机制可以灵活关注图像的各个区块,结合类UNet结构能够多尺度地提取图像上下文间的关联信息,对强后处理的图像有着较好的鲁棒性。实验结果表明,所提模型在对抗JPEG压缩、高斯模糊等常见的后处理操作以及在不同社交媒体传播场景的数据集上的定位性能上明显优于目前主流的篡改定位模型,展现出了优异的鲁棒性。

主 题 词:强后处理场景 图像篡改定位 鲁棒性 金字塔视觉转换器 

学科分类:080903[080903] 0809[工学-计算机类] 08[工学] 080501[080501] 0805[工学-能源动力学] 080502[080502] 

核心收录:

D O I:10.11959/j.issn.1000−436x.2024079

馆 藏 号:203127955...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分