看过本文的还看了

相关文献

该作者的其他文献

文献详情 >藏语语料库加工方法研究 收藏
藏语语料库加工方法研究

藏语语料库加工方法研究

作     者:才让加 CAI Rangjia

作者机构:青海师范大学藏文信息研究中心西宁810008 

基  金:国家语委基金(No.MZ115-018) 国家社会科学基金(No.07BYY035) 国家社会科学重点基金(No.05AYY001) 973计划前期研究专项(No.2010CB334708) 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2011年第47卷第6期

页      码:138-139,146页

摘      要:为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。

主 题 词:藏语语料库 规范 词类 标记集 词典 分词标注 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1002-8331.2011.06.038

馆 藏 号:203648922...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分