限定检索结果

检索条件"机构=中国人民大学数据工程与知识工程教育部重点实验室"
113 条 记 录,以下是1-10 订阅
视图:
排序:
数据故事化方法:析出、重组与叙事
收藏 引用
《图书情报工作》2024年 第13期68卷 28-40页
作者:靳庆文数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息资源管理学院北京100872 
[目的/意义]数据驱动时代面临数据认知困难、解释结果晦涩难懂以及模型决策可信度不足等诸多挑战。融合可解释性结果的数据故事化方法,为应对上述挑战、增强数据利用价值提供理论支撑和解决方案。[方法/过程]梳理模型无关局可解释性...
来源:详细信息评论
数据故事化解释中分类型预测结果的反转点识别方法研究——基于LIME算法
收藏 引用
《情报理论与实践》2024年 第2期47卷 170-177页
作者:靳庆文 朝乐门 张晨中国人民大学信息资源管理学院北京100872 数据工程与知识工程教育部重点实验室北京100872 
[目的/意义]实现数据故事化中的反转点识别,有助于非专业人士理解分类型预测结果的产生原因,同时对于推动故事情节发展并使其快速到达故事高潮点具有促进作用。[方法/过程]提出故事点与反转点概念,基于LIME解释技术和反转点识别过程,设...
来源:详细信息评论
数据库资源与参数协同调优方法研究
收藏 引用
《计算机科学》2024年 第6期51卷 104-110页
作者:李雨航 谭睿雄 柴云鹏数据工程与知识工程教育部重点实验室北京100872 数据库与商务智能教育部工程研究中心北京100872 中国人民大学信息学院北京100872 
数据库中存在许多配置项,包括数据库内的配置参数以及署环境的虚拟机资源配置,这些配置项共同决定了数据库的读写性能和资源消耗。在资源弹性伸缩的云环境下,用户关注数据库的服务性能和资源消耗成本。然而,由于配置项众多且负载...
来源:详细信息评论
智能数据分区与布局研究
收藏 引用
《软件学报》2022年 第10期33卷 3819-3843页
作者:刘欢 刘鹏举 王天一 何雨琪 孙路明 李翠平 陈红数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 
数据时代,数据规模庞大,由数据进行驱动的应用分析场景日益增多.如何快速、高效地从这些海量数据中提取出用以分析决策的信息,给数据库系统带来重大挑战.同时,现代商业分析决策对分析数据的实时性要求数据库系统能够同时快速处理ACID...
来源:详细信息评论
基于区域划分与降维的高维学习型索引
收藏 引用
《软件学报》2023年 第5期34卷 2413-2426页
作者:张少敏 蔡盼 李翠平 陈红数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 
数据量与数据复杂度不断增加的时代,大数据处理与分析成为当前的热门研究内容,高维空间数据的使用越来越频繁,数据检索和访问速度成了衡量数据处理系统性能的重要指标.因此,如何设计实现一种高效的高维索引结构,提高查询访问速率、降...
来源:详细信息评论
GPU数据库OLAP优化技术研究
收藏 引用
《软件学报》2023年 第11期34卷 5205-5229页
作者:张延松 刘专 韩瑞琛 张宇 王珊数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 国家卫星气象中心北京100081 
GPU数据库近年来在学术界和工业界吸引了大量的关注.尽管一些原型系统和商业系统(包括开源系统)开发了作为下一代的数据库系统,但基于GPU的OLAP引擎性能是否真的超过CPU系统仍然存有疑问,如果能够超越,那什么样的负载/数据/查询处理模...
来源:详细信息评论
基于谱聚类的在线数据库垂直分区多阶段生成方法
收藏 引用
《软件学报》2023年 第6期34卷 2804-2832页
作者:刘鹏举 李好洋 王天一 刘欢 孙路明 任逸飞 李翠平 陈红数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 华为云数据库创新Lab广东深圳518100 
垂直数据分区技术从逻辑上将满足一定语义条件的数据库表属性存放在同一个物理块中,进而降低数据访问成本,提高查询效率.数据库查询负载中的每条查询通常只与数据库表中的分属性有关,因此只需使用数据库表的某个属性子集便可以得到准...
来源:详细信息评论
一种基于管算存分离的内存数据库实现技术
收藏 引用
《计算机学报》2023年 第4期46卷 761-779页
作者:张延松 韩瑞琛 刘专 张宇中国人民大学数据工程与知识工程教育部重点实验室北京100872 中国人民大学信息学院北京100872 中国人民大学中国调查与数据中心北京100872 英特尔(中国)研究中心有限公司北京100190 国家卫星气象中心北京100081 
在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管...
来源:详细信息评论
华为昇腾神经网络加速器性能评测与优化
收藏 引用
《计算机学报》2022年 第8期45卷 1618-1637页
作者:鲁蔚征 张峰 贺寅烜 陈跃国 翟季冬 杜小勇中国人民大学大型科学仪器共享平台北京100872 数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息学院北京100872 清华大学计算机科学与技术系北京100084 
华为昇腾是一款新型神经网络加速器.与GPU相比,昇腾加速器专门面向神经网络计算,设计了专用计算单元,核心算力集中在低精度,基于昇腾的软件栈与GPU有所差异.现有研究大多专注于GPU上的深度学习负载性能分析和优化,由于昇腾平台推出不久...
来源:详细信息评论
AI治理中的公平性及其评价方法研究
收藏 引用
《情报资料工作》2022年 第5期43卷 24-33页
作者:刘璇 朝乐门数据工程与知识工程教育部重点实验室(中国人民大学)北京100872 中国人民大学信息资源管理学院北京100872 
[目的/意义]针对人工智能应用中表现出的偏见和歧视,本文从数据、算法和系统运维出发,分析了AI治理中公平性的影响因素和评价方法,为AI的公平性治理提供解决思路。[方法/过程]基于人工智能治理流程和AI的公平性治理机制两个维度,本文首...
来源:详细信息评论
聚类工具 回到顶部