看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于农业垂直搜索引擎中文分词词典的构建研究 收藏
基于农业垂直搜索引擎中文分词词典的构建研究

基于农业垂直搜索引擎中文分词词典的构建研究

作     者:张启宇 于辉辉 陈英义 王磊 ZHANG Qi-yu;YU Hui-hui;CHEN Ying-yi;WANG Lei

作者机构:中国农业大学烟台研究院山东烟台264670 中国农业大学信息与电气工程学院北京100083 农业部农业信息获取技术重点实验室北京100083 山东省农业科学院科技信息研究所山东济南250100 

基  金:山东省自主创新专项(2012CX90204) 

出 版 物:《广东农业科学》 (Guangdong Agricultural Sciences)

年 卷 期:2015年第42卷第3期

页      码:165-169页

摘      要:在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以My SQL数据库为例设计了农业领域专用的分词词典。该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间。该农业分词词典结构对其他领域和行业也具有借鉴意义。

主 题 词:中文分词 农业词典 My SQL 词性编码 

学科分类:082804[082804] 08[工学] 0828[工学-建筑类] 081203[081203] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1004-874X.2015.03.034

馆 藏 号:203320448...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分