面向中文文本分类的对抗样本生成方法
作者机构:内蒙古科技大学信息工程学院内蒙古包头014010 中国人民大学信息学院北京100872 包头医学院计算机科学与技术系内蒙古包头014010
基 金:国家自然科学基金项目(61562065) 内蒙古自治区自然科学基金项目(2019MS06001,2019MS06036)
出 版 物:《电子器件》 (Chinese Journal of Electron Devices)
年 卷 期:2023年第46卷第5期
页 码:1349-1356页
摘 要:针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确定修改策略生成对抗样本。使用两个主流的模型卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)在不同分类数据集上验证其有效性和可转移性。实验结果表明,与其他攻击方法相比,WordBeguiler具有攻击成功率高、扰动率低的优势,同时既保留了原始语义也一定程度上保证了语法正确性,并且可以有效地转移到BERT模型中。
主 题 词:中文文本分类 对抗样本 深度神经网络 汉字特征 黑盒
学科分类:0839[0839] 08[工学] 081201[081201] 0812[工学-测绘类]
D O I:10.3969/j.issn.1005-9490.2023.05.029
馆 藏 号:203124383...