看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多策略的文档信息过滤技术的应用研究 收藏
基于多策略的文档信息过滤技术的应用研究

基于多策略的文档信息过滤技术的应用研究

作     者:杨陟卓 韩燮 YANG Zhi-zhuo;HAN Xie

作者机构:中北大学电子与计算机科学技术学院山西太原030051 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2009年第30卷第5期

页      码:1262-1266页

摘      要:为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户。从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性。实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量。

主 题 词:信息检索 信息过滤 文本特征抽取 TFIDF+ 空间向量模型 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 081202[081202] 

D O I:10.16208/j.issn1000-7024.2009.05.026

馆 藏 号:203159366...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分