限定检索结果

检索条件"主题词=nutch"
34 条 记 录,以下是11-20 订阅
视图:
排序:
基于nutch海关主题搜索引擎的研究与设计
收藏 引用
《社科纵横(新理论版)》2012年 第4期 52-53页
作者:沈雷明上海海关学院上海201204 
运用nutch搜索引擎技术开源和完整网络搜索的设计思想,构建了基于nutch的海关情报资源主题搜索引擎系统模型,分析研究了系统各功能子模块的主要作用和功能整合方案,并提出了系统实施运行的相关技术路线;从而较好地解决了海关系统目前尚...
来源:详细信息评论
nutch中文分词插件的编写与实现
收藏 引用
《信息技术》2010年 第2期34卷 97-100,103页
作者:蔡小艳 沈巍 胡婷婷 曹永刚武汉军械士官学校光电仪器与指挥控制系武汉430075 江苏省邮电规划设计院有限责任公司南京210006 
开源搜索引擎nutch是针对英文环境开发的,针对nutch对中文进行单字切分的不足,在剖析nutch分词器的基础上,基于nutch的插件机制,结合中科院的中文分词系统ICTCLAS,成功地实现了nutch对中文的词语切分,完善了基于nutch的中文搜索引擎的...
来源:详细信息评论
基于nutch和Hadoop的分布式搜索引擎探究
收藏 引用
《信息通信》2012年 第5期25卷 120-121页
作者:李伟贵州师范大学数学与计算机科学学院贵州贵阳550001 
分析Apache开源框架nutch和Hadoop的系统结构,利用nutch和Hadoop设计高效、可靠、可扩展的分布式搜索引擎,来解决搜索引擎对海量数据的处理和存储问题。
来源:详细信息评论
利用nutch设计实现生物医学信息垂直搜索引擎
收藏 引用
《北京生物医学工程》2010年 第6期29卷 638-640,644页
作者:王小磊 李立 赵东升军事医学科学院卫生勤务与医学情报研究所北京100850 
在网络的海量信息搜索过程中,医学情报研究和信息服务机构,经常需要构建面向专题的垂直搜索系统以满足特定人群的需求。本文利用nutch和Lucene等开源软件设计了一个面向生物医学信息的垂直搜索引擎系统,并对网页信息抓取、格式处理、内...
来源:详细信息评论
基于nutch的用户行为分析搜索引擎的实现
收藏 引用
《科技资讯》2009年 第15期7卷 20-20,22页
作者:顾珺上海大学计算机工程与科学学院上海200072 
nutch是一个开放源代码的Web搜索引擎,由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。未来的搜索引擎的发展趋势之一是个性化和智能化,本文在研究开源nutch的基础上设计实现了一个具有关联用户搜索行为的搜索引擎。
来源:详细信息评论
nutch构建垂直搜索引擎的方案
收藏 引用
《知识经济》2009年 第7X期 118-120页
作者:余栋柱 黄讴广州市烟草专卖局510310 广东省电信规划设计院510630 
搜索引擎是互联网上检索信息的工具,能有效地提高信息定位的效率。通用搜索引擎的查询结果难以满足精确搜索的要求,于是垂直搜索成为搜索引擎的一个重要补充。垂直搜索引擎与通用搜索引擎最大的区别就是前者对网页进行了页面净化、信息...
来源:详细信息评论
基于nutch搜索引擎的E-learning系统开发
收藏 引用
《湖北工业大学学报》2011年 第5期26卷 73-77页
作者:陈建峡 李倩倩 王春枝湖北工业大学计算机学院湖北武汉430068 
针对现有的E-learning学习系统没有可供学习者搜索知识的功能,自带的检索也只能为学习者提供无差别的、千人一面的搜索结果,从而使学习者丧失学习兴趣的问题,设计和实现了一个新的E-learning系统.在开源的在线学习系统chamilo的基础上,...
来源:详细信息评论
基于补偿的nutch搜索引擎的设计与实现
收藏 引用
《科学技术与工程》2011年 第34期11卷 8619-8623页
作者:马睿 黄穗暨南大学广州510632 
nutch的排序机制使得一些传统的高质量的页面经常出现Web检索结果的前面,而新加入的高质量的Web页面很难被用户找到。针对传统基于链接算法中对新内容的迟钝性,提出了对网页的补偿算法,对Web上在一段时间内好的资源信息使其排名结果上升...
来源:详细信息评论
汉语词法分析系统ICTCLAS在nutch-0.9中的应用与实现
收藏 引用
《军械工程学院学报》2008年 第5期20卷 63-66,70页
作者:蔡小艳 寇应展 沈巍 郑伟军械工程学院计算机工程系河北石家庄050003 北京航空航天大学电子信息工程学院北京100083 
分析了nutch的语言分析器结构,针对nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统...
来源:详细信息评论
基于nutch的增量网页信息采集系统的设计与实现
收藏 引用
《软件》2015年 第11期36卷 100-104页
作者:代鹏华北计算技术研究所北京100083 
本文介绍了nutch网络爬虫的系统架构和抓取网页信息流程,针对nutch网页信息数据采集冗余的问题,引入了增量更新方法和适应性采集周期计算方法,首先使用Simhash算法和汉明距离计算出网页相似度,根据网页相似度计算出网页采集周期,然后根...
来源:详细信息评论
聚类工具 回到顶部