看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于辅助集的专利主题分析领域停用词选取 收藏
基于辅助集的专利主题分析领域停用词选取

基于辅助集的专利主题分析领域停用词选取

作     者:俞琰 赵乃瑄 Yu Yan;Zhao Naixuan

作者机构:南京工业大学信息服务部南京210009 东南大学成贤学院计算机工程系南京211816 

基  金:国家社会科学基金项目"大数据时代支持创新设计的多维度多层次专利文本挖掘研究"(项目编号:17BTQ059)的研究成果之一 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2018年第2卷第11期

页      码:95-103页

摘      要:[目的]提出一种领域停用词自动选取方法,以提高专利主题分析的区分度和质量。[方法]针对要进行专利主题分析的目标集,引入专利辅助集,提出基于辅助集文档频率和类别熵两个指标,衡量词语在辅助集中分布情况,自动识别领域停用词。[结果]实验结果表明,基于辅助集的领域停用词选取方法能够提高专利主题分析的区分度和质量。[局限]辅助集的选取类型和数量有待进一步研究。[结论]基于辅助集的领域停用词选取方法能够有效地衡量词的分布特征,从而更准确地选取专利主题分析中的领域停用词。

主 题 词:专利主题分析 领域停用词 辅助集 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 120501[120501] 120502[120502] 

核心收录:

D O I:10.11925/INFOTECH.2096-3467.2018.0240

馆 藏 号:203416126...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分