看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向司法大数据的文本主题OLAP系统 收藏
面向司法大数据的文本主题OLAP系统

面向司法大数据的文本主题OLAP系统

作     者:王玲 刘晓清 何震瀛 奚军庆 项焱 WANG Ling;LIU Xiaoqing;HE Zhenying;XI Junqing;XIANG Yan

作者机构:复旦大学软件学院上海200438 复旦大学计算机科学技术学院上海200438 司法部信息中心北京100020 武汉大学法学院武汉430000 

基  金:国家重点研发计划(2018YFC0830900) 

出 版 物:《智能计算机与应用》 (Intelligent Computer and Applications)

年 卷 期:2021年第11卷第9期

页      码:28-34,41页

摘      要:随着大数据技术的发展,加强司法大数据应用成为推进司法现代化建设的重要手段,如何处理司法大数据中的非结构化数据亟待解决。为此,本文提出了面向司法大数据的文本主题OLAP系统。在离线数据处理模块中,设计了Span数据模型,并定义了多种针对该模型的操作符;设计了基于规则的文本行政区划归类方法,并构建了主题立方体。在线上查询模块中,实现了基于倒排索引的关键词搜索方法和最大独特主题范围查询,提供了上卷、下钻、切片等功能。通过在大规模的真实数据集上对系统进行测试,实验结果证明了该系统的合理性和实用性。

主 题 词:大数据处理 OLAP 行政区划归类 独特主题 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.3969/j.issn.2095-2163.2021.09.007

馆 藏 号:203105814...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分