看过本文的还看了

相关文献

该作者的其他文献

文献详情 >用于中文色情文本过滤的近邻法构造算法 收藏
用于中文色情文本过滤的近邻法构造算法

用于中文色情文本过滤的近邻法构造算法

作     者:苏贵洋 李建华 马颖华 李生红 SU Gui-yang,LI Jian-hua,MA Ying-hua,LI Sheng-hong(School of Information Security, Shanghai Jiaotong Univ., Shanghai 200030, China)

作者机构:上海交通大学信息安全学院上海200030 

基  金:国家高技术研究发展(863)项目资助(2001AA142160 2002AA145090) 

出 版 物:《上海交通大学学报》 (Journal of Shanghai Jiaotong University)

年 卷 期:2004年第38卷第z1期

页      码:76-79页

摘      要:从不良信息中最为普及的中文色情文本过滤入手,用近邻法(KNN)算法构造对比了4种特征项选择的方法在中文色情文本中的应用,它们分别是字、词、标点符号和词性等特征.试验表明,中文色情文本不同特征项的选择对中文色情文本的分类效果起到了重要的作用.实验同时表明,所设计的过滤器在保证速度的前提下,很好地完成了基于内容的高精度过滤.

主 题 词:文本过滤 信息过滤 文本表示 向量空间模型 特征选择 

学科分类:0839[0839] 08[工学] 

核心收录:

D O I:10.3321/j.issn:1006-2467.2004.z1.019

馆 藏 号:203115371...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分