看过本文的还看了

相关文献

该作者的其他文献

文献详情 >藏文自动分词系统的设计 收藏
藏文自动分词系统的设计

藏文自动分词系统的设计

作     者:才智杰 才让卓玛 CAI Zhi Jie;CAI Rang Zhuo Ma

作者机构:青海师范大学藏文信息处理省部共建教育部重点实验室青海西宁810008 

基  金:科技部973前期预研项目(2010CB334708) 国家社会科学基金项目(09XYY024 07BYY035) 国家语委项目(MZ05-118) 青海师范大学科研创新计划项目 青海师范大学中青年科研基金项目 

出 版 物:《计算机工程与科学》 (Computer Engineering & Science)

年 卷 期:2011年第33卷第5期

页      码:151-154页

摘      要:语料库作为基本的语言数据库和知识库,是各种自然语言处理方法实现的基础。随着统计方法在自然语言处理中的广泛应用,语料库建设已成为重要的研究课题。自动分词是句法分析的一项不可或缺的基础性工作,其性能直接影响句法分析。本文通过对85万字节藏语语料的统计分析和藏语词的分布特点、语法功能研究,介绍基于词典库的藏文自动分词系统的模型,给出了切分用词典库的结构、格分块算法和还原算法。系统的研制为藏文输入法研究、藏文电子词典建设、藏文字词频统计、搜索引擎的设计和实现、机器翻译系统的开发、网络信息安全、藏文语料库建设以及藏语语义分析研究奠定了基础。

主 题 词:中文信息处理 语料库 藏文分词 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1007-130X.2011.05.030

馆 藏 号:203387278...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分