看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于在线属性聚合的海量软件层次分类 收藏
基于在线属性聚合的海量软件层次分类

基于在线属性聚合的海量软件层次分类

作     者:王涛 王怀民 尹刚 李翔 杨程 邹鹏 WANG Tao;WANG Huai-Min;YIN Gang;LI Xiang;YANG Cheng;ZOU Peng

作者机构:国防科学技术大学计算机学院并行与分布处理国家重点实验室长沙410073 装备学院北京101400 

基  金:国家"八六三"高技术研究发展规划项目基金(2012AA011201) 国家自然科学基金(60903043)资助~~ 

出 版 物:《计算机学报》 (Chinese Journal of Computers)

年 卷 期:2013年第36卷第10期

页      码:2007-2018页

摘      要:互联网规模的软件资源库正从根本上改变传统的软件开发模式,资源库中海量软件的高效层次分类对基于互联网资源的软件开发具有重要意义.传统软件分类方法基于软件源代码或字节码实现粗粒度的扁平分类,并且只在小规模数据集上进行了验证.文中提出了一种基于软件在线属性聚合的层次分类方法,设计了一个层次分类框架,基于跨资源库软件在线描述和标签的加权聚合,实现对海量软件的高效层次化分类.文中在超过18 000个开源软件上进行交叉验证,实验结果表明文中提出的在线属性加权聚合方法能显著提高软件分类效果.在粗粒度扁平分类下文中方法能够达到基于源代码/字节码分类近似的性能,而且,与相关工作比较,文中方法实现了涵盖123个更细粒度类别的层次化分类,能够更有效地对海量软件进行分类.

主 题 词:软件资源库 开源软件 层次分类 在线属性 

学科分类:0810[工学-土木类] 0808[工学-自动化类] 0839[0839] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 081202[081202] 

核心收录:

D O I:10.3724/SP.J.1016.2013.02007

馆 藏 号:203935131...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分