看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于大数据新闻网站文本挖掘的网络舆情监测设计与实现 收藏
基于大数据新闻网站文本挖掘的网络舆情监测设计与实现

基于大数据新闻网站文本挖掘的网络舆情监测设计与实现

作     者:梁永春 焦文强 田立勤 LIANG Yongchun;JIAO Wenqiang;TIAN Liqin

作者机构:华北科技学院计算机学院北京东燕郊065201 

基  金:国家自然科学基金项目(61163050) 

出 版 物:《华北科技学院学报》 (Journal of North China Institute of Science and Technology)

年 卷 期:2018年第15卷第4期

页      码:82-87,92页

摘      要:当今中国,网民人数已经超过人口总数的一半,因此网络舆情监测具有十分重要的意义。本文首先应用网络爬虫技术实现对新闻报道和对应网民评论文本数据获取。因为数据量大,所以选择Hadoop集群进行文本数据储存。其次,通过中文分词技术对文本数据按词语进行拆分,并对得到的词语进行过滤和挑选,得到关键词。新闻报道文本中获取的关键词用于新闻类型与主题的判别,网民评论中的关键字反映了网民对此新闻报道的观点和态度。最后,应用此方法,对"中美贸易战"事件进行网络舆情监测,从获得的新闻报道主题和网民评论的关键字表明,本文介绍的网络舆情监测方法具有可行性和实用性。

主 题 词:舆情监测 网络爬虫 中文分词 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1672-7169.2018.04.015

馆 藏 号:203369625...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分