限定检索结果

检索条件"主题词=中文文本分类"
12 条 记 录,以下是1-10 订阅
视图:
排序:
新型快速中文文本分类器的设计与实现
收藏 引用
《计算机工程与应用》2009年 第22期45卷 53-55页
作者:陈艳秋 熊耀华东北大学东软信息技术学院计算机科学与技术系辽宁大连100623 
为了提高中文文本分类的效率与精度,设计了一种新型的分类器。该分类器采用基于词频、互信息和类别信息的综合评估函数进行选择特征;在特征权重计算上,由于传统TF-IDF方法没有考虑特征类间和类内分布,提出了一种将词频和综合评估函数值...
来源:详细信息评论
Bagging算法在中文文本分类中的应用
收藏 引用
《计算机工程与应用》2009年 第5期45卷 135-137,179页
作者:张翔 周明全 耿国华 侯凡西北大学可视化技术研究所西安710127 西安建筑科技大学信息与控制工程学院西安710055 北京师范大学信息科学与技术学院北京100875 
Bagging算法是目前一种流行的集成学习算法,采用一种改进的Bagging算法Attribute Bagging作为分类算法,通过属性重取样获取多个训练集,以kNN为弱分类器设计一种中文文本分类器。实验结果表明Attribute Bagging算法较Bagging算法有更好...
来源:详细信息评论
一种基于类别强信息特征和贝叶斯算法的中文文本分类
收藏 引用
《计算机应用与软件》2014年 第8期31卷 330-333页
作者:陈艳秋 孙培立大连东软信息技术学院计算机科学与技术系辽宁大连100623 大连海洋大学经济管理学院辽宁大连100623 
为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相...
来源:详细信息评论
基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统
收藏 引用
中文信息学报》2006年 第3期20卷 29-35页
作者:毛伟 徐蔚然 郭军北京邮电大学模式识别与智能系统实验室北京100876 
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数...
来源:详细信息评论
Bagging中文文本分类器的改进方法研究
收藏 引用
《小型微型计算机系统》2010年 第2期31卷 281-284页
作者:张翔 周明全 耿国华西北大学可视化技术研究所陕西西安710127 西安建筑科技大学信息与控制工程学院陕西西安710055 北京师范大学信息科学与技术学院北京100875 
文本分类研究中,集成学习是一种提高分类器性能的有效方法.Bagging算法是目前流行的一种集成学习算法.针对Bagging算法弱分类器具有相同权重问题,提出一种改进的Bagging算法.该方法通过对弱分类分类结果进行可信度计算得到投票权重...
来源:详细信息评论
面向中文文本分类的对抗样本生成方法
收藏 引用
《电子器件》2023年 第5期46卷 1349-1356页
作者:弓燕 张晓琳 刘月峰 刘立新 徐立内蒙古科技大学信息工程学院内蒙古包头014010 中国人民大学信息学院北京100872 包头医学院计算机科学与技术系内蒙古包头014010 
针对深度神经网络鲁棒性问题,提出了一种面向中文文本分类的黑盒对抗样本生成方法WordBeguiler。该方法结合汉字的字形、字音特征构建对抗搜索空间,设计了新的扰动定位方式寻找影响分类结果的重要字或词组,并根据概率权重选取的方法确...
来源:详细信息评论
基于词频的中文文本分类研究
收藏 引用
《现代情报》2009年 第2期29卷 179-181页
作者:姚兴山南京大学信息管理系江苏南京210093 
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在...
来源:详细信息评论
基于统计分词的中文文本分类系统
收藏 引用
《电脑知识与技术》2005年 第4期 71-74页
作者:D吴雅娟 柳培林 丁子睿大庆石油学院计算机与信息技术学院,黑龙江大庆163318 大庆石油管理局通信公司,黑龙江大庆163453 
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于统计的二元分词方法应用于中文文本分类,并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方...
来源:详细信息评论
结合词性信息的基于注意力机制的双向LSTM的中文文本分类
收藏 引用
《河北科技大学学报》2018年 第5期39卷 447-454页
作者:高成亮 徐华 高凯河北科技大学信息科学与工程学院河北石家庄050018 清华大学计算机系北京100089 
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信...
来源:详细信息评论
中文非功能需求描述的识别与分类方法研究
收藏 引用
《软件学报》2019年 第10期30卷 3115-3126页
作者:贾一荻 刘璘清华大学软件学院 
非功能需求描述系统质量相关的属性,是软件设计决策的重要依据和评估标准.与功能需求的描述相比,非功能需求描述通常比较分散,且往往是隐含的.当采集到的需求原始描述内容较多时,逐一进行人工判别和整理需要耗费大量的时间和精力.针对...
来源:详细信息评论
聚类工具 回到顶部