看过本文的还看了

相关文献

该作者的其他文献

文献详情 >新冠肺炎疫情信息累积更新采集系统的设计与实现 收藏
新冠肺炎疫情信息累积更新采集系统的设计与实现

新冠肺炎疫情信息累积更新采集系统的设计与实现

作     者:王君 马乐荣 WANG JUN;MA Le-rong

作者机构:延安大学数学与计算机科学学院陕西延安716000 

基  金:国家自然科学基金资助项目(61866308) 延安市高层次人才专项项目(203010096) 延安大学研究生教育创新计划项目(YCX2020104) 

出 版 物:《延安大学学报(自然科学版)》 (Journal of Yan'an University:Natural Science Edition)

年 卷 期:2021年第40卷第2期

页      码:96-99页

摘      要:突如其来的新冠肺炎疫情打乱了人们的正常生活和工作节奏,面对各种不同来源的新冠肺炎疫情数据,如何及时获取疫情信息这对人们的工作、生活有很大帮助。本文使用Python编程语言,结合Scrapy框架,基于Splash对页面中的JavaScript代码进行渲染的技术,设计并实现了一种新冠肺炎疫情信息累积更新采集系统。实验表明,该系统能同时采集国内31个省(自治区、直辖市)官方网站发布的疫情数据,并能累积更新。同时,将采集的数据清洗后存入数据库中,为下游任务疫情数据可视化、趋势预测等提供数据支撑。

主 题 词:新冠肺炎 疫情数据 累积更新 数据爬虫 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.13876/J.cnki.ydnse.2021.02.096

馆 藏 号:203103547...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分