看过本文的还看了

相关文献

该作者的其他文献

文献详情 >SVM词库智能更新技术在搜索分类中的应用 收藏
SVM词库智能更新技术在搜索分类中的应用

SVM词库智能更新技术在搜索分类中的应用

作     者:齐富民 谢晓尧 景凤宣 QI Fu-min;XIE Xiao-yao;JING Feng-xuan

作者机构:贵州师范大学贵州省信息与计算科学重点实验室贵州贵阳550001 

基  金:贵州省工业攻关基金项目(黔科合GY字3009) 贵州省科学技术基金项目(黔科合J字2213) 贵州师范大学2012年度自然科学类学生科研基金重点项目(201219) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2014年第35卷第6期

页      码:2017-2023页

摘      要:为了研究搜索引擎的文本预分类准确率,从词库对搜索引擎的影响角度出发,提出了基于支持向量机的词库智能更新技术。利用网络爬虫丰富的数据源作为生僻词来源,用基础词库结合语法库对网络爬虫获取的文本语料进行分析处理,同时不断充实临时词库;利用支持向量机判定文本的所属类别,确定生僻词的类别标识;根据临时词库中的生僻词的统计数量,将生僻词加入到词库,达到扩大词库的目的。将扩展后的词库应用于搜索引擎的搜索意图识别实验中,实验结果表明,扩展后的词库可以减少句子拆分的错误率并提高搜索主题分类的准确率。

主 题 词:支持向量机 词库智能更新 语法库 搜索引擎 主题分类 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-7024.2014.06.028

馆 藏 号:203148850...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分