看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于类名引导的弱监督文本分类 收藏
基于类名引导的弱监督文本分类

基于类名引导的弱监督文本分类

作     者:周悦尧 奚雪峰 崔志明 盛胜利 仇亚进 ZHOU Yue-yao;XI Xue-feng;CUI Zhi-ming;SHENG Sheng-li;QIU Ya-jin

作者机构:苏州科技大学电子与信息工程学院江苏苏州215000 苏州市科技局苏州市虚拟现实智能交互及应用重点实验室江苏苏州215000 苏州科技大学苏州智慧城市研究院江苏苏州215000 德州理工大学计算机学院得克萨斯州拉伯克市79401 

基  金:国家自然科学基金项目(61876217、62176175) 江苏省“六大人才高峰”高层次人才基金项目(XYDXX-086) 苏州市科技计划基金项目(SGC2021078) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2023年第44卷第8期

页      码:2329-2336页

摘      要:针对弱监督文本分类过于依赖专家生成种子词的局限,提出一种基于类名引导生成种子词的弱监督文本分类方法。使用Skip-Gram模型学习单词的向量表示,借助vMF(von Mises Fisher)分布对用户提供的类名与语料库之间的关系进行建模,综合考虑语义相关性和语义特异性,由此生成一组高质量的种子词,无需依赖专家经验;迭代使用种子词生成伪标签和文档分类器;扩展种子词,进一步提升模型性能。在NYT和20 Newsgroups两个公开数据集上的实验结果(F1-score)表明了所提弱监督文本分类方法的有效性。

主 题 词:弱监督 文本分类 词向量 冯米塞尔分布 语义相关性 语义特异性 深度学习 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2023.08.012

馆 藏 号:203123391...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分