文献检索-宁波市创意产业特色资源库

现代汉语“V+N”序列关系的平行处理: 收藏
分享
引用; 《计算机工程与应用》2010年第30期46卷 8-10页; 作者：冯敏萱南京师范大学文学院南京210097; 目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同...; 目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型。实验证明,在自动分词和词性标注的PCCE1000文本中,v+n单语处理的F值为72.14%,而进一步利用汉英词典和英语译文信息,F值到达了88.81%,提高了16.67个百分点。; 来源：详细信息评论

英汉平行语料中双语兼类词消歧研究: 收藏
分享
引用; 《山东大学学报（工学版）》2011年第6期41卷 18-23,30页; 作者：冯敏萱曲维光南京师范大学文学院江苏南京210046 南京师范大学计算机科学与技术学院江苏南京210046 江苏省信息安全保密技术研究中心江苏南京210097; 对于一部分目前统计处理消歧效果较差、但出现频率又很高的兼类词,手工编写针对性极强的消歧规则。在未经词汇对齐的平行语料中,实现了基于个性规则的词性消歧方法。本研究为5个典型兼类词(过去、计划、与、back、so)设计的平行消歧算法...; 对于一部分目前统计处理消歧效果较差、但出现频率又很高的兼类词,手工编写针对性极强的消歧规则。在未经词汇对齐的平行语料中,实现了基于个性规则的词性消歧方法。本研究为5个典型兼类词(过去、计划、与、back、so)设计的平行消歧算法,在大规模平行语料中得到了验证,平均F值达到了98.45%。研究结果表明该规则具有不受上下文长度和模板数量限制、特别适合于双语平行处理、消歧效果好等优点。; 来源：详细信息评论

可供性在情感化食品包装设计中的应用路径研究: 收藏
分享
引用; 《包装工程》2024年第22期45卷 242-249页; 作者：王佳春冯敏萱陈浩金陵科技学院南京211169 南京师范大学南京210097; 目的从可供性的视角出发,探讨情感化食品包装设计的新路径,以带给用户良好的情感体验。方法首先通过收集优秀的情感化食品包装设计案例,然后以可供性理论为基础对优秀案例进行深入分析,探索可供性在各个优秀案例中的具象体现形式,在此...; 目的从可供性的视角出发,探讨情感化食品包装设计的新路径,以带给用户良好的情感体验。方法首先通过收集优秀的情感化食品包装设计案例,然后以可供性理论为基础对优秀案例进行深入分析,探索可供性在各个优秀案例中的具象体现形式,在此分析的基础上挖掘出可供性与情感化食品包装设计之间的链接点,并归纳提炼出可供性理论指导下的情感化食品包装设计策略,为情感化食品包装设计提供新的思路。结论通过探索分析情感化食品包装中的可供性体现,总结归纳出了商品本源表征的直接映射、用户心智模型的合理迁移,以及剖析使用场景的外延需求三条可操作性的思路,为情感化食品包装在本能层、行为层,以及反思层的设计提供参考,从可供性的视角助力食品包装的情感化设计。同时文中将可供性理论引入情感化食品包装设计中,不仅是对拓宽食品包装的情感化设计思路进行的一次积极探索,也是对拓展可供性理论应用方向的一次尝试。; 来源：详细信息评论

融合部首信息的古汉语自动分词与词性标注一体化分析: 收藏
分享
引用; 《数据分析与知识发现》2024年第11期8卷 102-113页; 作者：常博林袁义国李斌许智星冯敏萱王东波南京师范大学文学院南京210097 南京师范大学语言大数据与计算人文研究中心南京210097 南京农业大学信息管理学院南京210095; [目的]针对现有古汉语自动分词与词性标注技术存在的准确度不高、效率不高等问题,提出一种融合部首信息的古汉语自动分词与词性标注一体化模型.[方法]基于7万余条汉字及其部首的数据,构建部首向量表示模型Radical2Vector.并将Radical2Ve...; [目的]针对现有古汉语自动分词与词性标注技术存在的准确度不高、效率不高等问题,提出一种融合部首信息的古汉语自动分词与词性标注一体化模型.[方法]基于7万余条汉字及其部首的数据,构建部首向量表示模型Radical2Vector.并将Radical2Vector模型与古汉语文本表示模型SikuRoBERTa相结合,共同拼接BiLSTM-CRF模型作为实验的主体模型结构.同时,设计分词与词性双层标注方案,在《左传》数据集上进行自动分词与词性标注一体化实验.[结果]模型分词任务的F1值达到95.75%,词性标注任务的F1值达91.65%,相比基线模型分别提高8.71和13.88个百分点.[局限]仅融合了每个汉字的单个部首信息,未利用汉字的其他部件信息.[结论]本文成功融入汉字部首信息,有效提升了古汉语文本的表示效果.通过分词与词性标注的一体化方案,本文构建的模型在分词与词性标注任务上表现出色.; 来源：详细信息评论

数量结构的自动识别方案: 收藏
分享
引用; 《玉溪师范学院学报》2006年第1期22卷 59-62页; 作者：冯敏萱南京师范大学文学院江苏南京210097; 数量结构是现代汉语中的一个重要组成部分。对于中文信息处理而言,实现其自动识别将对查找中文文本中的重要命名实体有很大的帮助。但从目前的自动识别程序的开放测试结果来看,乃存在错标、漏标等现象。因此,我们在今后的程序的算法设...; 数量结构是现代汉语中的一个重要组成部分。对于中文信息处理而言,实现其自动识别将对查找中文文本中的重要命名实体有很大的帮助。但从目前的自动识别程序的开放测试结果来看,乃存在错标、漏标等现象。因此,我们在今后的程序的算法设计中还需要进一步的改善。; 来源：详细信息评论

基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究: 收藏
分享
引用; 《中文信息学报》2020年第4期34卷 1-9页; 作者：程宁李斌葛四嘉郝星月冯敏萱南京师范大学文学院江苏南京210097 哈佛大学计量社会科学研究所美国剑桥02138; 古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析...; 古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析一体化的标注方法,基于BiLSTM-CRF神经网络模型在四种跨时代的测试集上验证了不同标注层次下模型对断句、词法分析的效果以及对不同时代文本标注的泛化能力。研究表明,一体化的标注方法对古汉语的断句、分词及词性标注任务的F1值均有提升。综合各测试集的实验结果,断句任务F1值达到78.95%,平均提升了3.5%;分词任务F1值达到85.73%,平均提升了0.18%;词性标注任务F1值达到72.65%,平均提升了0.35%。; 来源：详细信息评论

基于深度学习的古籍文本自动断句与标点一体化研究: 收藏
分享
引用; 《图书情报工作》2022年第22期66卷 134-141页; 作者：袁义国李斌冯敏萱贺胜王东波南京师范大学文学院南京210097 南京师范大学数字与人文研究中心南京210023 南京农业大学信息管理学院南京210095; [目的/意义]中国拥有海量的古代典籍,利用计算机对古籍文本进行自动断句与标点有助于加快古籍资源的转化利用。现有研究主要存在两个亟待解决的问题。首先,将古籍断句与标点分为两个串行任务,会引起错误传递。其次,自动标注的标点也较...; [目的/意义]中国拥有海量的古代典籍,利用计算机对古籍文本进行自动断句与标点有助于加快古籍资源的转化利用。现有研究主要存在两个亟待解决的问题。首先,将古籍断句与标点分为两个串行任务,会引起错误传递。其次,自动标注的标点也较为混乱,对长距离可嵌套的成对引号标注研究较少。[方法/过程]通过对大规模古籍语料库的标点符号频率统计,结合现有标点符号用法标准,明确古文自动标点的符号体系。根据点号含有断句信息,提出断句标点一体化处理方案,直接在没有断句的古籍文本上进行自动标点。并通过设计多元引号标记集和段首填充占位符,解决长距离可嵌套成对引号的自动标注难题。算法上根据序列标注方法,采用SikuRoBRETa-BiLSTM-CRF在1亿多字的繁体古籍文本语料上完成模型训练。[结果/结论]在开放测试集《左传》上,点号标注的F1值为77.09%,断句达到91.72%;对单个引号的标注F1值达到89.28%,成对引号为83.88%。结果表明本文的方法有效地提升了古籍文本的自动断句与自动标点效果,有效地解决了引号的自动标注问题。; 来源：详细信息评论

面向信息处理的《古籍汉字分级字表(7000字)》的研制: 收藏
分享
引用; 《辞书研究》2024年第6期 66-80,I0002页; 作者：余雪冯敏萱李斌南京一中明发滨江分校江苏210031 南京师范大学文学院/南京师范大学语言大数据与计算人文研究中心江苏210097; 分级字表是文本难度分级的重要基础资源。文章基于大规模古籍文本语料库,在统计构建《古籍汉字通用字表》的基础上,通过挖掘古籍汉字在字形、字音、字义以及应用层面的11个分级计量特征,设计了古籍汉字学习优先级的分级评价体系,将各汉...; 分级字表是文本难度分级的重要基础资源。文章基于大规模古籍文本语料库,在统计构建《古籍汉字通用字表》的基础上,通过挖掘古籍汉字在字形、字音、字义以及应用层面的11个分级计量特征,设计了古籍汉字学习优先级的分级评价体系,将各汉字表示为基于计量特征学习优先级的字向量,借助相似度计算,实现了古籍汉字学习优先级别的3级划分,得到《古籍汉字分级字表(7000字)》。该字表包括甲级字1516个、乙级字2421个,丙级字3063个,能够从文字层面为古汉语文本难度分级提供必要的基础字表,有助于古汉语文本分级研究,助力面向辞书编撰的语言文字信息化平台建设,进而为古文读写能力水平测试、古文篇章的自动分级等研究奠定基础。; 来源：详细信息评论

我国大规模通用语普及率调查研究及改进策略: 收藏
分享
引用; 《南京师范大学文学院学报》2021年第1期 130-136页; 作者：冯敏萱毛雪芬曹紫琰李素琴陈小荷南京师范大学文学院江苏南京210097 南京理工大学教务处江苏南京210014; 科学制定语言政策,发挥语言效用,离不开大规模通用语普及率的调查研究。本文综述了国内外大规模通用语普及历程及调查方法,指出我国当前调查的个别指标精确性有待提升,分析出样本选择、调查场景、评测机制及实施规范等均有可提升空间并...; 科学制定语言政策,发挥语言效用,离不开大规模通用语普及率的调查研究。本文综述了国内外大规模通用语普及历程及调查方法,指出我国当前调查的个别指标精确性有待提升,分析出样本选择、调查场景、评测机制及实施规范等均有可提升空间并提出相应改进策略。此外,结合少数民族和汉族地区学习普通话的特点与差异,提出普及率分体系评估以及各指标设计权重的设想。未来工作,应更重视通用语普及质量并继续加大计算机投入,确保语言普查的最终实现。; 来源：详细信息评论

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案：

收藏书架

请选择收藏分类：

检索条件订阅

申请转借

引用

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案： 新增检索档案 确定 取消

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

检索条件订阅

申请转借

引用

高级检索表达式检索

高级检索表达式检索

请选择保存的检索档案：

请选择收藏分类：