看过本文的还看了

相关文献

该作者的其他文献

文献详情 >绿色网络网页正文内容提取算法 收藏
绿色网络网页正文内容提取算法

绿色网络网页正文内容提取算法

作     者:龙珑 邓伟 LONG Long;DENG Wei

作者机构:广西师范学院计算机与信息工程学院南宁530023 广西肿瘤防治研究所南宁530021 

基  金:国家创新基金资助项目(10C26224504901) 广西自然科学基金资助项目(2011GXNSFB0180825) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2013年第39卷第7期

页      码:252-256页

摘      要:互联网中的网页有较多商业广告,绿色网络系统无法过滤其中具有不良内容的网站。为解决该问题,提出一种绿色网络网页正文内容提取算法。通过文件对象模型树识别与提取网页正文内容模块,使用基于粒子群的权值优化算法对网页正文各个板块特征权值进行评分,利用与不良关键字的比较,确定并过滤不良网页。实验结果表明,经粒子群权值算法优化提取后,绿色网络系统对不良网页的识别准确率为86.9%,召回率为95.6%,F值为91.02%,比优化前有较大提高。

主 题 词:绿色网络 网瘾 不良内容 粒子群优化 正文提取 

学科分类:08[工学] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-3428.2013.07.056

馆 藏 号:203233282...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分