看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于LEBERT-CRF和知识图谱的中文地址修正补全方法 收藏
基于LEBERT-CRF和知识图谱的中文地址修正补全方法

基于LEBERT-CRF和知识图谱的中文地址修正补全方法

作     者:王钦民 刘鹏 邓国威 

作者机构:暨南大学信息科学技术学院广东 广州 

出 版 物:《计算机科学与应用》 (Computer Science and Application)

年 卷 期:2023年第13卷第4期

页      码:808-818页

摘      要:为解决人工中文地址因输入不准确造成的地址解析错误问题,本文首先结合词汇增强的基于Transformer的双向编码表征模型(LEBERT)与条件随机场(CRF),提出了LEBERT-CRF模型,相较BERT-长短期记忆-CRF模型(BERT-BiLSTM-CRF)在分词准确率、召回率以及F值上分别提升了1.45%、1.89%和1.67%。然后,通过标准层级地址数据,并引入别名、旧名等地址信息构建了地址知识图谱库。最终,利用经过分词处理的地址数据,并根据地址数据存在的几种可能错误类型,设计出一种基于地址知识图谱库的匹配算法,对分词完的地址数据进行匹配修正并得到准确地址信息,相较于中文省份城市地区匹配器(CPCA),地址解析在一级地址、二级地址、三级地址上解析准确率分别提升了2.12%、2.36%和1.12%。

主 题 词:中文地址分词 中文地址匹配 LEBERT CRF 知识图谱 

学科分类:08[工学] 0812[工学-测绘类] 

D O I:10.12677/CSA.2023.134080

馆 藏 号:203121211...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分