看过本文的还看了

相关文献

该作者的其他文献

文献详情 >古汉语词义标注语料库的构建及应用研究 收藏
古汉语词义标注语料库的构建及应用研究

古汉语词义标注语料库的构建及应用研究

作     者:舒蕾 郭懿鸾 王慧萍 张学涛 胡韧奋 SHU Lei;GUO Yiluan;WANG Huiping;ZHANG Xuetao;HU Renfen

作者机构:北京师范大学中文信息处理研究所北京100875 北京师范大学人文宗教高等研究院北京100875 北京师范大学汉语文化学院北京100875 

基  金:国家自然科学基金(62006021) 北京市社会科学基金青年学术带头人项目(21DTR037) 

出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)

年 卷 期:2022年第36卷第5期

页      码:21-30页

摘      要:古汉语以单音节词为主,其一词多义现象十分突出,这为现代人理解古文含义带来了一定的挑战。为了更好地实现古汉语词义的分析和判别,该研究基于传统辞书和语料库反映的语言事实,设计了针对古汉语多义词的词义划分原则,并对常用古汉语单音节词进行词义级别的知识整理,据此对包含多义词的语料开展词义标注。现有的语料库包含3.87万条标注数据,规模超过117.6万字,丰富了古代汉语领域的语言资源。实验显示,基于该语料库和BERT语言模型,词义判别算法准确率达到80%左右。进一步地,该文以词义历时演变分析和义族归纳为案例,初步探索了语料库与词义消歧技术在语言本体研究和词典编撰等领域的应用。

主 题 词:古代汉语 语料库 词义标注 词义消歧 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1003-0077.2022.05.002

馆 藏 号:203112235...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分