看过本文的还看了

相关文献

该作者的其他文献

文献详情 >改进的并行随机森林算法及其包外估计 收藏
改进的并行随机森林算法及其包外估计

改进的并行随机森林算法及其包外估计

作     者:钱雪忠 秦静 宋威 Qian Xuezhong;Qin Jing;Song Wei

作者机构:江南大学物联网技术应用教育部工程研究中心江苏无锡214122 

基  金:国家自然科学基金资助项目(61673193) 中央高校基础研究资助项目(JUSRP51510 JUSRP51635B) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2018年第35卷第6期

页      码:1651-1654页

摘      要:传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差。然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不可见的分块数据上。对此分析MR_RF与RF的区别,设计了一个新的适用于MR_RF的包外泛化误差估计方法。主要将测算限定在数据块内,最终森林的泛化误差估计取块结果的平均。实验结果表明,新的包外估计方法与交叉验证在默认分块上的结果近似,却随着分块的增加出现偏差,对此分析了可能的原因,并给出选择集成方案思想,且分块大小与分类准确率成反比,与分类速率成正比。

主 题 词:MapReduce 随机森林 包外估计 泛化误差 交叉验证 

学科分类:08[工学] 081202[081202] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1001-3695.2018.06.011

馆 藏 号:203289706...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分