看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于关键词和摘要相关度的文献聚类研究 收藏
基于关键词和摘要相关度的文献聚类研究

基于关键词和摘要相关度的文献聚类研究

作     者:魏建香 苏新宁 Wei Jianxiang;Su Xinning

作者机构:南京大学信息管理系南京210093 南京人口管理干部学院信息科学系南京210042 

基  金:国家自然科学基金(40771163) 江苏省高校青蓝工程“优秀青年骨干教师”基金(2004~2008)资助项目 

出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)

年 卷 期:2009年第28卷第2期

页      码:220-224页

摘      要:现有的文献聚类方法都是通过文献关键词来进行的。本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法。首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确。其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤。最后,实现算法并进行了大量的实验仿真。通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量。结果表明,本文提出的文献聚类算法是一种行之有效的方法。

主 题 词:文献聚类 相似度 关键词 摘要 最大距离 

学科分类:0501[文学-中国语言文学类] 12[管理学] 050103[050103] 1201[管理学-管理科学与工程类] 05[文学] 

核心收录:

D O I:10.3772/j.issn.1000-0135.2009.02.010

馆 藏 号:203162456...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分