看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于叠加编码的Web网页抓取路径损耗估计 收藏
基于叠加编码的Web网页抓取路径损耗估计

基于叠加编码的Web网页抓取路径损耗估计

作     者:邢计亮 Xing Jiliang

作者机构:邢台广播电视大学河北邢台054000 

出 版 物:《科技通报》 (Bulletin of Science and Technology)

年 卷 期:2015年第31卷第6期

页      码:181-183页

摘      要:对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。

主 题 词:Web网页 文本特征 抓取路径 数据挖掘 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.13774/j.cnki.kjtb.2015.06.061

馆 藏 号:203151183...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分