看过本文的还看了

相关文献

该作者的其他文献

文献详情 >众包数据库综述 收藏
众包数据库综述

众包数据库综述

作     者:柴成亮 李国良 赵天宇 骆昱宇 于明鹤 CHAI Cheng-Liang;Li Guo-Liang;ZHAO Tian-Yu;LUO Yu-Yu;YU Ming-He

作者机构:清华大学计算机系北京100084 东北大学软件学院沈阳110167 

基  金:国家自然科学基金(61632016,61925205) 国家“九七三”重点基础研究发展计划项目基金(2015CB358700)资助 

出 版 物:《计算机学报》 (Chinese Journal of Computers)

年 卷 期:2020年第43卷第5期

页      码:948-972页

摘      要:现如今,很多数据处理与分析的任务仅仅依靠机器算法难以达到理想的效果.因此,众包技术应运而生,其利用群体的智慧来解决对于计算机而言比较难的问题.其中,众包平台(例如Amazon Mechanical Turk)为众包技术的应用提供了有力的支撑.平台上有成千上万的网络大众来为任务发布者解决问题.然而,对于任务发布者而言,其与众包平台交互是不方便的,因为平台会要求任务发布者设置很多参数甚至书写代码.所以研究者们借鉴传统数据库的思想,提出了众包数据库的概念,其封装了任务发布者、众包平台以及众包工人之间的复杂交互过程,为发布者提供友好的API.使发布者可以通过简单的类SQL语言与平台交互.在这篇综述中,我们首先介绍众包的概念;然后介绍设计众包数据库时需考虑的一些基本技术,例如真值推理、任务分配,代价优化等;接着我们介绍几种主流的众包数据库系统.此外,我们会介绍对于不同的数据库算子,包括选择、连接、排序等优化技术.最后我们会介绍该领域未来的研究方向与挑战.

主 题 词:数据库 众包 查询优化 质量控制 成本控制 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.11897/SP.J.1016.2020.00948

馆 藏 号:203930732...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分