限定检索结果

检索条件"主题词=hadoop"
1,048 条 记 录,以下是81-90 订阅
视图:
排序:
hadoop集群部署实验的设计与实现
收藏 引用
《实验技术与管理》2015年 第1期32卷 145-149页
作者:孟永伟 黄建强 曹腾飞 王晓英青海大学计算机技术与应用系青海西宁810016 
阐述了hadoop软件框架中的两大核心技术——HDFS分布式文件系统架构和MapReduce分布式处理机制,设计了hadoop集群部署实验的具体方案,主要包括实验目的、实验区域的划分、节点的规划等,并且以一组实验设备为例,详细说明了配置方法,给出...
来源:详细信息评论
hadoop云平台下Nutch中文分词的研究与实现
收藏 引用
《小型微型计算机系统》2013年 第12期34卷 2772-2776页
作者:朱潜 吴辰铌 朱志良 刘洪娟东北大学软件学院沈阳110819 东北大学信息科学与工程学院沈阳110819 
Nutch是开源搜索引擎,hadoop是Apache开发的类似于Google GFS和MapReduce的开源云平台.利用Nutch和hadoop可以设计高效、可靠、可扩展的搜索引擎,然而Nutch的分词模块对中文进行单字切分,不符合在汉语中以词语切分的习惯,为了解决这个问...
来源:详细信息评论
基于hadoop的邮政寄递大数据分析系统设计与实现
收藏 引用
《中国科学院大学学报(中英文)》2017年 第3期34卷 395-400页
作者:王卫锋 杨林中国科学院大学计算机与控制学院信息动态学与工程应用实验室北京100049 
面对海量邮政寄递数据,现有的构建于关系数据库上的数据仓库系统在做数据分析时具有建设成本高、分析能力会遇到瓶颈等缺点。hadoop具有高可扩展、高性能和低成本等优点,被广泛应用于大数据的存储和分析。基于对hadoop开源框架的研究,...
来源:详细信息评论
hadoop中处理小文件的四种方法的性能分析
收藏 引用
《计算机工程与应用》2016年 第9期52卷 44-49页
作者:李三淼 李龙澍安徽大学计算机科学与技术学院合肥230601 
hadoop的设计初衷是为了存储和分析大数据,其最擅长处理的是大数据集。但是在实际应用中,却存在着大量的小文件。一般情况下有四种处理海量小文件的方法,分别为默认输入格式Text Input Format、为处理小文件而设计的Combine File Input ...
来源:详细信息评论
基于hadoop的云GIS体系结构研究
收藏 引用
《测绘通报》2013年 第11期 93-97页
作者:范建永 龙明 熊伟信息工程大学地理空间信息学院河南郑州450052 
在研究现有云GIS体系结构的基础上,基于开源云计算平台hadoop设计并实现了一种云GIS体系结构。本结构分为物理层、云平台层、服务层、应用层4层。其特点包括利用HBase对海量空间数据及部门业务数据进行分布式存储,以解决HDFS不善管理小...
来源:详细信息评论
hadoop平台下海量图像处理实现
收藏 引用
《计算机工程与设计》2017年 第4期38卷 976-980页
作者:谭台哲 向云鹏广东工业大学计算机学院广东广州510006 河源广工大协同创新研究院广东河源517000 
针对hadoop不直接支持处理海量小图像文件且不能高效管理这些小文件的问题,为让开发者在不了解hadoop内部机制的情况下开发处理海量图像的算法,研究并实现hadoop图像处理框架。制定图像数据在Java开发语言中的表示,使其适用于MapReduce...
来源:详细信息评论
基于hadoop的智能电网数据安全存储设计
收藏 引用
《电力系统保护与控制》2013年 第14期41卷 136-140页
作者:张少敏 李晓强 王保义华北电力大学控制与计算机工程学院河北保定071003 
针对智能电网下海量数据的存储问题及数据保密性和完整性需求,分析了现有安全存储方案的特点,结合智能电网应用环境的特殊场合,设计了一种基于hadoop的智能电网数据安全存储方案。该方案充分利用了HBase高性能优势和现代密码技术,将密...
来源:详细信息评论
基于hadoop的在线网络日志分析系统研究
收藏 引用
《计算机应用与软件》2014年 第8期31卷 311-316页
作者:杨锋英 刘会超黄淮学院信息工程学院河南驻马店463000 黄淮学院网络信息管理中心河南驻马店463000 
网络日志分析对网络安全管理具有重要意义,但现有的网络日志分析系统具有无法处理海量日志数据、采用离线模式、处理时延较长等弊端。因此,提出网络日志数据的分级归档机制,实现海量数据的分级优化存储功能。通过将传统的网络日志分析...
来源:详细信息评论
基于hadoop的广域网分布式主题爬虫系统框架
收藏 引用
《计算机工程与科学》2015年 第4期37卷 670-675页
作者:王淑芬 高军礼 邹普 宋海涛广东工业大学自动化学院广东广州510006 华南理工大学工商管理学院广东广州510641 
广域网分布式爬虫与局域网爬虫相比有诸多的优势,而现有基于hadoop分布式爬虫的设计主要是面向局域网环境的。为解决hadoop分布式计算平台不适合部署于广域网的问题,设计了一个基于hadoop的广域网分布式爬虫系统框架。爬虫系统利用消息...
来源:详细信息评论
hadoop技术在海上智能电网状态监测数据存储中的应用
收藏 引用
《舰船科学技术》2017年 第3X期39卷 67-69页
作者:方鹏长江职业学院湖北武汉430074 
船舶智能电网技术快速发展,海上智能电网状态监测平台在设备监控、维护等方面发挥着重要作用,同时,也对海量数据处理提出了更严格的要求。本文设计基于hadoop技术的海上智能电网状态监测平台,以满足平台对海量数据处理性能的要求。
来源:详细信息评论
聚类工具 回到顶部