看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合形态特征的最大熵维吾尔语词性标注 收藏
融合形态特征的最大熵维吾尔语词性标注

融合形态特征的最大熵维吾尔语词性标注

作     者:帕力旦.吐尔逊 房鼎益 PALIDAN Tuerxun;FANG Ding-yi

作者机构:西北大学信息学院陕西西安710127 新疆大学软件学院新疆乌鲁木齐830046 

基  金:国家自然科学基金资助项目(61063043) 新疆维吾尔自治区高校基金资助项目(XJEDU2008I08) 新疆大学校院联合基金资助项目(XY080124) 新疆多语种信息技术重点实验室开放课题基金资助项目 

出 版 物:《西北大学学报(自然科学版)》 (Journal of Northwest University(Natural Science Edition))

年 卷 期:2015年第45卷第5期

页      码:721-726页

摘      要:根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。

主 题 词:维吾尔语 词性标注 词缀 最大熵 特征提取 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 081203[081203] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.16152/j.cnki.xdxbzr.2015-05-007

馆 藏 号:203711492...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分