看过本文的还看了

相关文献

该作者的其他文献

文献详情 >班智达藏文标注词典设计 收藏
班智达藏文标注词典设计

班智达藏文标注词典设计

作     者:才智杰 才让卓玛 CAIzhijie;CAIrangzhuoma

作者机构:青海师范大学藏文信息研究中心青海西宁810008 

基  金:国家语委资助项目(MZ05-118) 国家社会科学基金资助项目(07BYY035 09XYY024) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2010年第24卷第5期

页      码:46-49页

摘      要:语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的结构及词典库索引查询算法。对85万字节藏语实验语料的分词和标注,分词准确率达99%,标注准确率达97%。

主 题 词:藏语语料库 分词 标注 词典 索引 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1003-0077.2010.05.008

馆 藏 号:203487600...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分