看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于PLSA模型的Web页面语义标注算法研究 收藏
基于PLSA模型的Web页面语义标注算法研究

基于PLSA模型的Web页面语义标注算法研究

作     者:王云英 

作者机构:湘南学院图书馆郴州423000 

出 版 物:《情报杂志》 (Journal of Intelligence)

年 卷 期:2013年第32卷第1期

页      码:141-144页

摘      要:高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。

主 题 词:语义标注 PLSA模型 潜在语义主题 标注算法 Web页面 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 120502[120502] 

核心收录:

D O I:10.3969/j.issn.1002-1965.2013.01.029

馆 藏 号:203151873...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分