文献详情 >基于BERT预训练模型的古汉语自动分词方法研究收藏

基于BERT预训练模型的古汉语自动分词方法研究

作者：高毅 GAO Yi

基　　金：陕西省职业技术教育项目(2020SZJSZ-061) 陕西省教育科学“十三五”规划项目(SGH16V049)

出版物：《电子设计工程》 (Electronic Design Engineering)

年卷期：2021年第29卷第22期

页码：28-32页

摘要：在自然语言的智能处理领域中,相较于现代汉语,古汉语的研究由于可用有效标注资源有限、种类欠缺,使得古汉语自然语言处理技术的发展相对缓慢。针对古汉语的分词任务,文中借助于双向最大匹配法则,通过训练多种古汉语语料库建立适用于古汉语自动分词的BERT模型,并在多种语料库上进行实验分析。与使用一般神经网络的模型相比,文中所提模型具有更优的训练效果。数据实验结果表明,在3种古汉语文献中双向匹配多阶段迭代训练分词方法获得的F1值分别为96.4%、96.4%、95.4%;而一般神经模型所获得的F1值为92.8%、92.8%和90.5%,即文中方法在古汉语的自动切词任务上具有更优的性能表现。

主题词：自动分词深度学习 BERT模型双向最大匹配准确度召回率

学科分类：081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类]

D　O　I：10.14022/j.issn1674-6236.2021.22.007

馆藏号：203106096...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于BERT预训练模型的古汉语自动分词方法研究

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于BERT预训练模型的古汉语自动分词方法研究

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：