文献检索-宁波市创意产业特色资源库

串匹配算法中模式串与文本之间关系的研究: 收藏
分享
引用; 《软件学报》2010年第7期21卷 1503-1514页; 作者：刘萍刘燕兵郭莉方滨兴中国科学院计算技术研究所北京100190 信息内容安全技术国家工程实验室北京100190 中国科学院研究生院北京100049; 经典的串匹配算法设计和分析中假设"字符互相独立并且等概率出现",这与实际应用环境差异很大,导致出现很多问题.考虑了字符的概率分布和上下文的关联,同时兼顾应用的方便,提出了命中密度的概念.在给出基本定义和扩展定义后,...; 经典的串匹配算法设计和分析中假设"字符互相独立并且等概率出现",这与实际应用环境差异很大,导致出现很多问题.考虑了字符的概率分布和上下文的关联,同时兼顾应用的方便,提出了命中密度的概念.在给出基本定义和扩展定义后,通过对4种类型的代表性算法的理论和实验分析,给出了命中密度与算法性能之间的关系.同时,在对命中密度的分析中得出一些极具价值的结论.对命中密度概念的多角度理解以及对它与算法性能关系的深入剖析都说明,命中密度作为一个特征量,可以从一个侧面刻画模式串和文本之间的相关性,它对算法的设计和分析以及串匹配领域研究工作的扩展都具有指导意义.; 来源：详细信息评论

一种面向大规模URL过滤的多模式串匹配算法: 收藏
分享
引用; 《计算机学报》2014年第5期37卷 1159-1169页; 作者：刘燕兵邵妍王勇刘庆云郭莉中国科学院信息工程研究所北京100093 信息内容安全技术国家工程实验室北京100093 北京邮电大学计算机学院北京100876 国家计算机网络与信息安全管理中心北京100029; 对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该...; 对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该算法在经典的SOG算法基础上,针对URL规则的特点,提出了最优窗口选择、模式串分组规约这两种优化技术,大幅度提高了SOG算法的匹配速度,在大规模URL规则集上效果尤其显著.该文设计的算法非常适合于大规模(100万级)URL实时在线匹配的应用环境.; 来源：详细信息评论

一种针对DFA状态爆炸的正则表达式匹配方法: 收藏
分享
引用; 《计算机工程》2019年第4期45卷 148-156页; 作者：王翔卢毓海马伟刘燕兵中国科学院大学网络空间安全学院北京100049 中国科学院信息工程研究所北京100093 信息内容安全技术国家工程实验室北京100093; 针对基于确定有限状态自动机的匹配引擎在大规模、复杂规则下会出现状态爆炸的问题,提出正则表达式子串抽取算法。通过将子串抽取算法应用于DFA状态爆炸场景,设计基于子串抽取的正则匹配引擎。实验结果表明,该算法在单个规则上运行时间...; 针对基于确定有限状态自动机的匹配引擎在大规模、复杂规则下会出现状态爆炸的问题,提出正则表达式子串抽取算法。通过将子串抽取算法应用于DFA状态爆炸场景,设计基于子串抽取的正则匹配引擎。实验结果表明,该算法在单个规则上运行时间可达10 ms量级,抽取率高达99%,同时匹配引擎具有较好的稳定性和可拓展性,且匹配速度优于相关开源匹配引擎。; 来源：详细信息评论

高性能文本索引系统的设计与实现: 收藏
分享
引用; 《中国科技论文》2014年第1期9卷 92-95,107页; 作者：路炜张宇周美孜刘燕兵王春露中国科学院信息工程研究所北京100093 河北师范大学附属民族学院石家庄050091 北京邮电大学计算机学院北京100876 中国人民大学信息学院北京100872; 针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器...; 针对传统文本索引技术空间消耗大、分词不准确等问题,设计并实现了高性能文本索引系统。该系统采用压缩的全文自索引算法,节省了空间开销,避免了自然语言分词方法的影响,配合通配符搜索算法扩展了模糊搜索的功能,在众核CPU高性能处理器上可实现多线程并行处理,提高了处理速度,整个系统的实现是基于Web方式的,可以跨平台运行。实验结果表明,该系统将文本索引的空间消耗降为原文本的50%左右,具有较高的实用价值。; 来源：详细信息评论

限定检索结果