看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Hadoop平台的主题概念股票挖掘系统应用研究 收藏
基于Hadoop平台的主题概念股票挖掘系统应用研究

基于Hadoop平台的主题概念股票挖掘系统应用研究

作     者:丁俊 DING Jun

作者机构:安徽工业经济职业技术学院计算机与艺术学院安徽合肥230051 

基  金:安徽省高校自然科学研究重点项目(KJ2019A1049) 2020年安徽省级精品线下开放课程《WEB程序设计(JSP)》(2020kfkc130) 

出 版 物:《西昌学院学报(自然科学版)》 (Journal of Xichang University(Natural Science Edition))

年 卷 期:2021年第35卷第2期

页      码:82-88页

摘      要:针对目前资本市场上快速挖掘某种主题概念股票的需求,提出了一种新思路,该思路以上市公司的核心题材、主营收入和资本运作3项数据为基础,进行主题概念相关指数的分析和计算,最终以此指数作为标准推荐主题概念相关股票,并开发了一套数据抓取程序和Web应用程序。数据抓取程序利用定时组件Quartz从各大财经网站抓取全体上市公司已公开的各类基本信息,存入分布式文件系统HDFS中;Web应用程序接收用户输入的查询关键字组合,系统利用抓取的数据集从公司收入、投资和核心概念3方面分析和计算出公司与用户需要查询的关键字组合的相关指数,最后汇总为总相关指数,总相关指数越高的公司,其相关度越高,相关度越高的公司越有可能就是用户想要查找的相关主题概念公司。通过这3方面的结合,在公司的过去和未来,在定性和定量等多个方面都进行了相关度的挖掘,从而计算出来的相关性将更加可靠、准确。

主 题 词:数据抓取 Hadoop 主题概念 股票挖掘 相关指数 

学科分类:12[管理学] 02[经济学] 0202[经济学-财政学类] 1201[管理学-管理科学与工程类] 020202[020202] 

D O I:10.16104/j.issn.1673-1891.2021.02.015

馆 藏 号:203104269...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分