看过本文的还看了

相关文献

该作者的其他文献

文献详情 >汉语方言自动聚类与分区及相关计算方法 收藏
汉语方言自动聚类与分区及相关计算方法

汉语方言自动聚类与分区及相关计算方法

作     者:江荻 JIANG Di

作者机构:中国社会科学院民族学与人类学研究所 江苏师范大学语言科学与艺术学院 

基  金:国家社会科学基金重大项目“中国民族语言大规模语法标注文本在线检索系统研制与建设研究”(21&ZD304) 

出 版 物:《暨南学报(哲学社会科学版)》 (Jinan Journal(Philosophy and Social Sciences))

年 卷 期:2022年第44卷第3期

页      码:10-23页

摘      要:本文回顾了学界对汉语方言之间相互关系的三种计量方法:特征统计、词源统计和词汇相似度计量,指出这三种计量方法采用的是非整体的、语音和词汇上受限的考察方法。文章阐述了一种更适用的计算模型,即Levenshtein Distance算法(莱文斯坦距离,或称编辑距离),该方法对语言或方言之间线性字符串的语音相似性和词汇对应性具有协调功能,并蕴含特征比对和词源概率效用。本文自动分区实验汇集了南方吴、闽、粤、湘、客、赣、徽、淮8个分区的78个方言,官话方言有东北、北京、冀鲁、胶辽、中原、兰银、西南108个方言,共计186个汉语方言点。每个方言收集了斯瓦迪士100个基本词,并对方言之间展开相似性计算。计算结果与传统分区基本一致,但更为精准。

主 题 词:汉语方言 聚类算法 莱文斯坦距离 自动分区 

学科分类:0303[法学-社会学类] 0501[文学-中国语言文学类] 050102[050102] 03[法学] 030303[030303] 05[文学] 

核心收录:

馆 藏 号:203110605...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分