看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于CRFs的专利文献领域术语抽取方法 收藏
基于CRFs的专利文献领域术语抽取方法

基于CRFs的专利文献领域术语抽取方法

作     者:王健 殷旭 吕学强 徐丽萍 WANG Jian;YIN Xu;LYU Xue-qiang;XU Li-ping

作者机构:北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京城市系统工程研究中心北京100089 

基  金:国家自然科学基金项目(61671070) 北京成像技术高精尖创新中心基金项目(BAICIT-2016003) 国家社会科学基金重大基金项目(14@ZH036) 国家语委重点基金项目(ZDI135-53) 国家语委重大课题基金项目(ZDA125-26) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2019年第40卷第1期

页      码:279-284页

摘      要:通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。

主 题 词:中文专利术语 术语抽取 条件随机场 序列标注 新能源汽车领域 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2019.01.047

馆 藏 号:203428657...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分