看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中医诊断古文的词性标注与特征重组 收藏
中医诊断古文的词性标注与特征重组

中医诊断古文的词性标注与特征重组

作     者:王国龙 杜建强 郝竹林 程春雷 蔡良俊 张鑫 WANG Guo-long;DU Jian-qiang;HAO Zhu-lin;CHENG Chun-lei;CAI Liang-jun;ZHANG Xin

作者机构:江西中医药大学计算机学院江西南昌330004 江西中医药大学临床医学院江西南昌330004 

基  金:国家973重点基础研究发展计划基金项目(2010CB530602) 国家自然科学基金项目(61363042) 江西中医药大学校级研究生创新专项基金项目(JZYC12C04) 江西省研究生创新基金项目(YC2013-S226) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2015年第36卷第3期

页      码:835-840,F0003页

摘      要:中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM),进行词性标注,结合词法分析,采用移进归约算法进行特征重组,生成中医诊断词汇。实验结果表明,改进的HMM的词性标注准确率在训练集和测试集中分别提高了2.58%和1.02%,特征重组结果是完整独立的诊断词汇,方便中医人员进行诊断分析,适合构成向量空间模型的特征。

主 题 词:中医诊断古文 键值对模型 隐马尔可夫模型 词性标注 特征重组 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2015.03.054

馆 藏 号:203120320...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分