看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Yarn架构下基于GA的Web日志挖掘技术 收藏
Yarn架构下基于GA的Web日志挖掘技术

Yarn架构下基于GA的Web日志挖掘技术

作     者:李静梅 张宝权 丁楠 LI Jing-mei;ZHANG Bao-quan;DING Nan

作者机构:哈尔滨工程大学计算机科学与技术学院哈尔滨150001 清华大学计算机系北京100084 

基  金:国家自然科学基金资助项目(61003036) 黑龙江省自然科学基金资助项目(F201124) 黑龙江省教育厅科学技术研究基金资助项目(12513048) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2014年第31卷第11期

页      码:3388-3391页

摘      要:提出了一种面向TB级别日志文件挖掘需求的日志挖掘技术。采用MapReduce编程模型设计并实现了一种基于子种群联姻策略的GA,并部署到Yarn架构上,使Yarn架构与GA有效结合。在算法Partition阶段,采用Round-Robin策略代替原有的哈希方法,使各个子种群基因更加趋向均匀分布,增加了子种群收敛效率和结果准确性,同时均衡各个节点运行负载,提高了系统性能。经测试,应用该技术的挖掘结果平均准确度达到93%以上,效率提升接近33%。

主 题 词:Yarn架构 日志挖掘 遗传算法 并行计算 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1001-3695.2014.11.042

馆 藏 号:203139674...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分