看过本文的还看了

相关文献

该作者的其他文献

文献详情 >“80后”职业人群二孩生育行为预测及影响因素分析——基于随机森林算法 收藏
“80后”职业人群二孩生育行为预测及影响因素分析——基于随机森林算法

“80后”职业人群二孩生育行为预测及影响因素分析——基于随机森林算法

作     者:张浩 侯丽艳 马萍 邱红燕 ZHANG Hao;HOU Liyan;MA Ping;QIU Hongyan

作者机构:宁夏医科大学公共卫生与管理学院银川750004 大连医科大学公共卫生学院大连116044 

基  金:国家社会科学基金(16BRK001) 

出 版 物:《宁夏医科大学学报》 (Journal of Ningxia Medical University)

年 卷 期:2021年第43卷第2期

页      码:149-155页

摘      要:目的探讨基于随机森林算法建立“80后”职业人群二孩生育行为的预测模型,并在此基础上采用多因素Logistic回归分析影响二孩生育行为的主要因素。方法采用现况研究设计,利用整群抽样方法分别对银川市、大连市和北京市10家企事业单位所有已婚育人群进行问卷调查,最终纳入1857例作为研究对象。将数据集按3∶1分为训练集和测试集,在训练集应用随机森林算法建立二孩生育行为预测模型,用测试集进行模型验证,通过混淆矩阵和受试者工作特征曲线(ROC)评价模型的预测效能。结果本次研究的1857例受试者中,已生育二孩者250例(13.5%)。采用随机森林算法在训练集建立二孩生育行为预测模型对测试集进行预测,ROC曲线下面积(AUC)为0.913,模型具有较高的精度;根据变量重要性排序及十折交叉验证结果确定6个最佳变量进行多因素Logistic回归分析。结果显示,社会支持得分越高,生育二孩的可能性越大,OR值为1.03(95%CI=1.01~1.05),大专学历者、本科学历者、研究生及以上学历者生育二孩的可能性分别是高中及以下学历者的0.56倍(95%CI=0.37~0.85)、0.45倍(95%CI=0.33~0.62)、0.25倍(95%CI=0.12~0.52),意愿子女数为两个以上者生育二孩的可能性是不要孩子的7.89倍(95%CI=2.29~27.15)。结论随机森林算法对“80后”职业人群二孩生育行为具有较高的预测效能,结合多因素Logistic回归分析能直观解释二孩生育行为的影响因素,社会支持、文化程度和意愿子女数是二孩生育行为的主要影响因素。

主 题 词:“80后” 二孩 随机森林算法 生育行为 

学科分类:1004[医学-公共卫生预防医学类] 100404[100404] 10[医学] 

D O I:10.16050/j.cnki.issn1674-6309.2021.02.010

馆 藏 号:203102599...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分