限定检索结果

检索条件"作者=丁祥武"
10 条 记 录,以下是1-10 订阅
视图:
排序:
VPM:列存储系统中基于带值路径的物化技术
收藏 引用
《计算机研究与发展》2012年 第10期49卷 2086-2094页
作者:丁祥武 余文兵 刘国华东华大学计算机科学与技术学院上海201620 计算机软件新技术国家重点实验室(南京大学)南京210093 
物化是列存储数据仓库查询中必不可少的操作,物化策略和物化技术直接影响到查询执行的性能,因此设计一种适应于列存储系统的物化策略和相关技术尤为重要.针对延迟物化可能重复读取数据块的缺陷,提出了基于带值路径的物化技术,简称VPM.首...
来源:详细信息评论
使用微软商务智能平台构建医疗数据仓库
收藏 引用
《计算机应用与软件》2013年 第11期30卷 238-242页
作者:丁祥武 黄忠睿东华大学计算机科学与技术学院上海201620 
数据仓库的构建是一个复杂的过程。Microsoft SQL Server 2008作为微软商业智能的核心,提供了一个比较全面的数据管理服务平台。在此基础上,微软商务智能(BI)工具为创建数据仓库、数据分析和生成报表提出了一套可伸缩的解决方案。介绍...
来源:详细信息评论
基于模型驱动元数据管理策略的研究
收藏 引用
《计算机应用与软件》2012年 第1期29卷 188-190页
作者:蒋楠 丁祥武东华大学计算机科学与技术学院上海201620 
目前,元数据管理存在这样的问题,各开发商使用不同的元模型来设计自己的数据仓库工具,而且对元数据的描述往往不一致,这样给数据集成带来很大的问题。使用一种基于模型驱动的方式,将元数据描述规范化,并运用基于模型驱动的公共仓库模型C...
来源:详细信息评论
PBPP:列存储系统中基于传递块缓冲区的流水线并行处理
收藏 引用
《计算机科学》2014年 第6期41卷 142-147页
作者:丁祥武 张光辉东华大学计算机与科学技术学院上海201620 
片上多核处理器(CMP)凭借其低功耗和低成本等优势迅速成为处理器市场的主角,它为多线程的实现提供了硬件支持。列存储技术在分析型应用中具有显著的优势。在列存储系统中,查询优化依然是最重要的问题之一。在列存储系统中,利用多核资源...
来源:详细信息评论
医疗领域文本结构化
收藏 引用
《计算机工程与设计》2017年 第10期38卷 2873-2878页
作者:丁祥武 张夕华东华大学计算机科学与技术学院上海201620 
现有通用分词工具对医疗专业术语的识别效果不理想,影响了医疗文本结构化的效果。针对该问题,提出一种基于词向量的新词发现方法,利用新词发现过程中构建的词库抽取信息,得到结构化数据。使用Google开源词向量工具word2vec训练文本,将...
来源:详细信息评论
Hadoop平台的安全加固方案
收藏 引用
《计算机工程》2018年 第12期44卷 94-101页
作者:丁祥武 张东辉东华大学计算机科学与技术学院上海201620 
针对Hadoop平台安全漏洞问题,通过分析Hadoop平台的安全现状,提出尚存的安全隐患,并对此安全隐患设计实现相关的加固方案。通过集成Hadoop认证系统与高可用的企业身份管理系统,实现由企业安全系统统一管理用户及权限信息,从而有效提高...
来源:详细信息评论
基于Spark的中文新词提取
收藏 引用
《计算机工程与设计》2017年 第11期38卷 3185-3191页
作者:丁祥武 张东辉东华大学计算机科学与技术学院上海201620 
为提高新词提取的准确率,根据新词在时间上的性质引入时间频率函数值特征,提出自动阈值获取算法。针对高处理效率特性,基于Spark平台对海量语料库中新词提取方案进行研究,提出一种分布式新词提取方案。对文本预处理,统计文本中字串的特...
来源:详细信息评论
基于Spark的并行ETL
收藏 引用
《计算机工程与设计》2017年 第9期38卷 2580-2585页
作者:丁祥武 解书亮 李继云东华大学计算机科学与技术学院上海201620 
针对大数据中的"海量"特征,基于Spark研究并行ETL技术的相关内容,提出并设计一种分布式ETL方案,对不同的转换处理分别采用对应的并行方法。针对一般的非聚集处理,如常见的数据清洗、数据格式标准化处理,采用基于分区的并行管...
来源:详细信息评论
MR-DC:基于MapReduce的轻量级数据压缩策略
收藏 引用
《智能计算机与应用》2015年 第1期5卷 77-80,83页
作者:田波 丁祥武东华大学计算机科学与技术学院上海201620 
大数据平台Hadoop为追求通用性,牺牲了对结构化大数据的处理性能。为此,提出了一种Hadoop平台上的针对结构化数据的压缩存储策略。首先,针对多种不同的数据类型,结合轻量级压缩算法的特点,设计了多种数据类型的压缩数据页;然后,设计了基...
来源:详细信息评论
基于Hadoop平台下日志分析系统的研究
收藏 引用
《无线互联科技》2018年 第5期15卷 56-57页
作者:陈小龙 丁祥武东华大学计算机科学与技术学院上海200051 
在信息系统当中,日志数据也就是用户对系统的操作记录以及系统自身的运行状况记录,对日志数据的有效分析,有利于排除系统故障、明确用户访问规律等。基于此,文章就Hadoop平台下日志分析系统展开研究,首先介绍了系统的总体框架,进一步对...
来源:详细信息评论
聚类工具 回到顶部