看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于HMM的京剧机构命名实体识别算法 收藏
基于HMM的京剧机构命名实体识别算法

基于HMM的京剧机构命名实体识别算法

作     者:乐娟 赵玺 LE Juan;ZHAO Xi

作者机构:北京理工大学计算机学院北京100081 北京戏曲艺术职业学院北京100068 北京联合大学师范学院北京100011 

基  金:北京市优秀人才培养计划基金资助项目(2012D002002000001) 北京市职业院校教师素质提高工程基金资助项目 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2013年第39卷第6期

页      码:266-271,286页

摘      要:针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法。利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列。根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机算法识别语料中的机构命名实体,并将新词加载到分词词典中。针对京剧领域语料进行开放测试验证,结果表明,该算法的识别正确率可达到99%。

主 题 词:开放领域 命名实体识别 隐马尔科夫模型 Viterbi算法 规则树 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1000-3428.2013.06.059

馆 藏 号:203264040...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分