看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于短语表示学习的主题识别及其表征词抽取方法研究 收藏
基于短语表示学习的主题识别及其表征词抽取方法研究

基于短语表示学习的主题识别及其表征词抽取方法研究

作     者:张金柱 于文倩 Zhang Jinzhu;Yu Wenqian

作者机构:南京理工大学经济管理学院南京210094 江苏省社会公共安全科技协同创新中心南京210094 

基  金:国家自然科学基金项目(项目编号:71974095)、国家自然科学基金青年项目(项目编号:71503125)的研究成果之一 江苏省社会科学基金项目(项目编号:17TQC003) 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2021年第5卷第2期

页      码:50-60页

摘      要:【目的】从更具专指性和表征能力的短语语义表示角度,设计基于短语表示学习的主题识别及其表征词抽取方法。【方法】基于依存句法分析抽取短语构建短语序列,并将短语序列视作词序列,将用于词表示的表示学习模型扩展形成短语表示学习模型,得到短语的语义向量表示,并结合向量聚类方法形成短语语义表示视角下的主题识别方法;将短语以及根据聚类得到的对应主题类别号作为一个整体构建短语主题序列,设计形成主题短语向量表示模型,实现主题和短语在同一向量空间的语义表示并计算相似度,从短语语义角度抽取与主题内容相关的短语作为主题表征词。【结果】与LDA模型相比,主题间平均相似度最多降低了0.27,主题识别结果区分度更高;抽取的表征词与主题语义相关,具有专指性和辨识度,结果可读性和解释性更强。【局限】需要在不同领域及不同数据集上进一步验证该方法的有效性。【结论】所提方法在研究主题识别及其表征词抽取方面具有更好的效果,并可扩展应用到其他领域。

主 题 词:主题识别 主题表征词 表示学习 语义向量 

学科分类:0810[工学-土木类] 1205[管理学-图书情报与档案管理类] 12[管理学] 120502[120502] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.11925/infbtech.2096-3467.2020.0060

馆 藏 号:203102365...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分