看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Web网页信息文本分类的研究 收藏
Web网页信息文本分类的研究

Web网页信息文本分类的研究

作     者:李净 袁小华 沈晓晶 LI Jing;YUAN Xiao-hua;SHEN Xiao-jing

作者机构:同济大学电信学院上海201804 上海水产大学信息学院上海200090 

基  金:上海高校优秀青年教师科研专项基金项目(B-8101-06-3802) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2008年第29卷第23期

页      码:6026-6028页

摘      要:面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题。针对Web文档的多主题特性,采用了多分类器模型,根据Web文档具有结构信息的特点,提出了系统的分类框架,对于短小文档采用Boosting和Web文档结构Bayesian分类模型,而对于长文档采用Boosting和综合Bayesian分类模型。实验结果表明,此分类框架具有较好的分类效果。

主 题 词:Web文本分类 多主题 多分类器 Boosting算法 综合Bayesian分类法 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

D O I:10.16208/j.issn1000-7024.2008.23.057

馆 藏 号:203456023...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分