看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于RSS的分布式新闻博客搜索引擎设计 收藏
基于RSS的分布式新闻博客搜索引擎设计

基于RSS的分布式新闻博客搜索引擎设计

作     者:刘峰 施水才 肖诗斌 王弘蔚 Liu Feng;Shi Shuicai;Xiao Shibin;Wang Hongwei

作者机构:北京信息科技大学中文信息处理研究中心北京100101 

基  金:国家自然科学基金项目"Web数据挖掘技术研究"(项目编号:60272084) 北京市教育委员会科技发展计划重点项目"面向大规模真实文本的数据挖掘技术"(项目编号:KZ200310772013) 北京市教委项目"中文垃圾邮件过滤和追踪技术研究"(项目编号:KM200510772008) "数字内容的安全身份认证与版权保护技术研究"(项目编号:KM200610772008)的研究成果之一 

出 版 物:《现代图书情报技术》 (New Technology of Library and Information Service)

年 卷 期:2007年第1期

页      码:29-32页

摘      要:针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分布式存储和传输,同时使用Bloom filter数据结构压缩索引文件,构建一个基于RSS的P2P分布式的新闻博客搜索引擎,从而达到对频繁更新站点的实时性搜索,同时减少存储成本。

主 题 词:RSS Pastry Bloom filter分布式搜索引擎 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1003-3513.2007.01.007

馆 藏 号:203840021...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分