看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多粒度图与注意力机制的半监督短文本分类 收藏
基于多粒度图与注意力机制的半监督短文本分类

基于多粒度图与注意力机制的半监督短文本分类

作     者:游奔 李晓红 姚锦 冯绍杰 YOU Ben;LI Xiaohong;YAO Jin;FENG Shaojie

作者机构:西北师范大学计算机科学与工程学院甘肃兰州730070 

基  金:国家自然科学基金(61862058,61967013) 甘肃省自然科学基金(20JR10RA076) 甘肃省高校产业支撑项目(2022CYZC11) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2024年第50卷第5期

页      码:83-90页

摘      要:短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战,且现有短文本分类方法通常忽略词项间的交互信息,不能充分挖掘隐含的语义信息,导致分类效率低下。针对上述问题,提出一种基于多粒度图与注意力机制的半监督短文本分类模型MgGAt。该模型在词粒度和文本粒度基础上构建2种类型的图,通过充分挖掘语义信息完成分类任务。首先构建词级图,捕获词嵌入,进而学习得到文本特征表示。在词级图上引入跳内注意力和跳间注意力,从多种语义角度有效提取词项间隐含的高阶信息,捕获语义丰富的词嵌入。同时依据词级子图的特点设计池化策略,聚合词嵌入,学习文本表征。其次构建文本级图,借助部分已知的标签信息,利用图神经网络的优势,在图上执行标签传播和推理,完成半监督短文本分类任务。在4个公开数据集上的实验结果表明,与基线模型相比,MgGAt模型的短文本分类精确率平均提升了1.18个百分点,F1值平均提升了1.37个百分点,具有更好的分类性能。

主 题 词:短文本分类 半监督分类 图神经网络 注意力机制 多粒度图 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.19678/j.issn.1000-3428.0066475

馆 藏 号:203127766...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分