看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于字序列的非结构化简历信息解析方法 收藏
基于字序列的非结构化简历信息解析方法

基于字序列的非结构化简历信息解析方法

作     者:陈毅 符磊 张剑 黄石磊 CHEN Yi;FU Lei;ZHANG Jian;HUANG Shi-lei

作者机构:重庆邮电大学光通信与网络重点实验室重庆400065 安徽大学计算智能与信号处理教育部重点实验室安徽合肥230601 北京大学深圳研究院广东深圳518057 深港产学研基地深圳市智能媒体和语音重点实验室广东深圳518057 深港产学研基地产业发展中心广东深圳518057 

基  金:国家自然科学基金项目(U1613209) 深圳市科技计划基金项目(JCYJ20170307151743672、JCYJ2015030154330711) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2019年第40卷第6期

页      码:1769-1774页

摘      要:为有效解决传统简历解析方法效率低、成本高、泛化能力差的问题,提出一种基于字序列的非结构化文本简历解析方法。利用BLSTM对字序列进行建模,获得一个包含字序列信息的词表示;由BLSTM神经网络强大的学习能力对特征进行学习,获得相应的特征;根据前后标签的约束,使用CRF获得最优标签序列(CBLSTM-CRF);利用梯度下降算法训练神经网络,使用预训练字向量、Dropout优化神经网络,完成对中文简历的解析工作。实验结果表明,CBLSTM-CRF方法对简历解析的效果优于传统方案,利用BLSTM对字序列进行建模的方法在其它模型上也取得了较好的效果。

主 题 词:中文简历 字序列 非结构化 神经网络 条件随机场 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2019.06.047

馆 藏 号:203673297...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分