限定检索结果

检索条件"作者=冯敏萱"
6 条 记 录,以下是1-10 订阅
视图:
排序:
基于深度学习的古籍文本自动断句与标点一体化研究
收藏 引用
《图书情报工作》2022年 第22期66卷 134-141页
作者:袁义国 李斌 冯敏萱 贺胜 王东波南京师范大学文学院南京210097 南京师范大学数字与人文研究中心南京210023 南京农业大学信息管理学院南京210095 
[目的/意义]中国拥有海量的古代典籍,利用计算机对古籍文本进行自动断句与标点有助于加快古籍资源的转化利用。现有研究主要存在两个亟待解决的问题。首先,将古籍断句与标点分为两个串行任务,会引起错误传递。其次,自动标注的标点也较...
来源:详细信息评论
现代汉语“V+N”序列关系的平行处理
收藏 引用
《计算机工程与应用》2010年 第30期46卷 8-10页
作者:冯敏萱南京师范大学文学院南京210097 
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同...
来源:详细信息评论
英汉平行语料中双语兼类词消歧研究
收藏 引用
《山东大学学报(工学版)》2011年 第6期41卷 18-23,30页
作者:冯敏萱 曲维光南京师范大学文学院江苏南京210046 南京师范大学计算机科学与技术学院江苏南京210046 江苏省信息安全保密技术研究中心江苏南京210097 
对于一部分目前统计处理消歧效果较差、但出现频率又很高的兼类词,手工编写针对性极强的消歧规则。在未经词汇对齐的平行语料中,实现了基于个性规则的词性消歧方法。本研究为5个典型兼类词(过去、计划、与、back、so)设计的平行消歧算法...
来源:详细信息评论
基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究
收藏 引用
《中文信息学报》2020年 第4期34卷 1-9页
作者:程宁 李斌 葛四嘉 郝星月 冯敏萱南京师范大学文学院江苏南京210097 哈佛大学计量社会科学研究所美国剑桥02138 
古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析...
来源:详细信息评论
数量结构的自动识别方案
收藏 引用
《玉溪师范学院学报》2006年 第1期22卷 59-62页
作者:冯敏萱南京师范大学文学院江苏南京210097 
数量结构是现代汉语中的一个重要组成部分。对于中文信息处理而言,实现其自动识别将对查找中文文本中的重要命名实体有很大的帮助。但从目前的自动识别程序的开放测试结果来看,乃存在错标、漏标等现象。因此,我们在今后的程序的算法设...
来源:详细信息评论
我国大规模通用语普及率调查研究及改进策略
收藏 引用
《南京师范大学文学院学报》2021年 第1期 130-136页
作者:冯敏萱 毛雪芬 曹紫琰 李素琴 陈小荷南京师范大学文学院江苏南京210097 南京理工大学教务处江苏南京210014 
科学制定语言政策,发挥语言效用,离不开大规模通用语普及率的调查研究。本文综述了国内外大规模通用语普及历程及调查方法,指出我国当前调查的个别指标精确性有待提升,分析出样本选择、调查场景、评测机制及实施规范等均有可提升空间并...
来源:详细信息评论
聚类工具 回到顶部