看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于原型网络的中文分类模型对抗样本生成 收藏
基于原型网络的中文分类模型对抗样本生成

基于原型网络的中文分类模型对抗样本生成

作     者:杨燕燕 谢明轩 曹江峡 王学宾 柳厅文 杜彦辉 YANG Yanyan;XIE Mingxuan;CAO Jiangxia;WANG Xuebin;LIU Tingwen;DU Yanhui

作者机构:中国人民公安大学信息网络安全学院北京100038 中国科学院信息工程研究所北京100084 中国科学院大学网络空间安全学院北京100049 

基  金:国家重点研发计划(2021YFB3100600) 中国科学院战略性先导科技专项(XDC02040400) 中国科学院青年创新促进会项目(2021153) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2023年第49卷第8期

页      码:54-62页

摘      要:对抗样本生成通过在原文本中添加不易察觉的扰动使深度学习模型产生错误输出,常用于检测文本分类模型的鲁棒性。现有对抗样本生成方法多数采用黑盒或白盒攻击,在生成对抗样本的过程中需要和受害模型交互,且攻击效果依赖于受害模型的结构和性能,通用性较差。面向中文文本的对抗样本生成方法使用的变换策略过于单一,无法生成多样化的中文对抗样本。针对这些问题,提出一种基于原型网络的对抗样本生成(AEGP)方法。在全面分析汉字结构特点和人类阅读习惯的基础上,设计8种可保持语义一致的中文文本变换策略。将卷积神经网络作为编码器,构建原型网络,利用同一类别下的其他文本辅助发现所需变换的文本片段。针对选择的文本片段应用文本变换策略,生成对抗样本。实验结果表明,AEGP方法具有较好的通用性,能生成多样化的对抗样本,且相比于基线方法,分类模型在AEGP方法生成的对抗样本上的准确率下降了9.21~32.64个百分点。

主 题 词:对抗样本生成 分类模型 原型网络 文本表示 变换策略 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.19678/j.issn.1000-3428.0066416

馆 藏 号:203122720...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分