看过本文的还看了

相关文献

该作者的其他文献

文献详情 >改进的基于内容的文件类型识别算法 收藏
改进的基于内容的文件类型识别算法

改进的基于内容的文件类型识别算法

作     者:曹鼎 罗军勇 CAO Ding;LUO Jun-yong

作者机构:解放军信息工程大学信息工程学院河南郑州450002 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2011年第32卷第12期

页      码:4246-4250页

摘      要:在现有基于内容的文件类型识别算法基础上,针对统计特征提取方面存在的问题,采用定长和变长窗口对文件二进制内容进行划分,提取文件的统计特征,并提出将特征选择应用于文件类型识别,结合特征的广度和稳定度设计出一种特征选择评估函数选择标志特征,从而建立文件类型模型,以此为标准识别文件类型。该算法不依靠特定文件类型的结构和关键标识,适用范围更为广泛。实验结果表明,该算法能有效提高文件类型的识别查准率和查全率。

主 题 词:文件类型识别 元组频率分布 文件二进制内容 余弦相似度 文件类型模型 特征选择 

学科分类:1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.16208/j.issn1000-7024.2011.12.064

馆 藏 号:203105726...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分