限定检索结果

检索条件"主题词=TFIDF "
11 条 记 录,以下是1-10 订阅
视图:
排序:
基于word2vec结合tfidf的词类扩充应用研究
收藏 引用
《电脑编程技巧与维护》2017年 第22期 23-25,50页
作者:王昕元 武君胜西北工业大学软件与微电子学院西安710072 
旨在解决在词类标注样本稀缺的环境下,通过某种算法来给词类进行关键词扩充,应用场景是互联网社交平台需要根据话题组即词类,进行广告推送,而词类扩充相关词能达到广告推送量大,而且精准的效果。实验中前后使用了两种算法进行研究,一种...
来源:详细信息评论
用于文本挖掘的特征选择方法tfidf及其改进
收藏 引用
《广西师范大学学报(自然科学版)》2003年 第A1期21卷 142-145页
作者:景丽萍 黄厚宽 石洪波北方交通大学计算机科学与技术学院北京100044 
文章使用tfidf特征选择方法对数据源进行预处理,建立了空间矢量模型,为文本分类提供了便利的数据结构.通过分类结果测试该特征选择方法的精确度.根据实验结果分析tfidf的优缺点,并提出改进的方法.
来源:详细信息评论
融合多特征tfidf文本分析的汽车造型需求提取方法
收藏 引用
《电子技术应用》2021年 第2期47卷 16-19,27页
作者:季曹婷 马伟锋 楼姣 马来宾浙江科技学院信息与电子工程学院浙江杭州310023 
针对汽车造型智能设计领域中如何有效提取用户需求的问题,提出一种融合多特征tfidf(词频-逆向文件频率)文本分析的汽车造型需求提取方法。首先,通过基于互信息与边界自由度获取大量未登录的专业词汇,优化和修正简单分词后的词汇;然后针...
来源:详细信息评论
一种基于敏感站点处理的Web信息检索系统
收藏 引用
《微计算机信息》2006年 第9X期22卷 56-58页
作者:屈强 魏鑫 梁延华解放军信息工程大学河南郑州450001 
本文设计实现了一种Web信息检索系统,面向有特定需求的特殊用户群,采用基于web站点处理的情报采集策略。先对各站点页面随机采样,提取出包含敏感信息页面的web站点,再采集敏感站点中的相关页面生成本地敏感资源库,并对库中的文本页面用...
来源:详细信息评论
模糊聚类算法EFCM及其在上下文广告关键词提取中的应用
收藏 引用
《计算机与现代化》2009年 第3期 81-83页
作者:陈艳燕 许晓昕北京联合大学北京100101 Symantec(Beijing) CDC北京100083 
随着互联网的高速发展,网络聊天(IM)软件中的上下文广告成为了网络主要赢利模式之一,也是网络营销中的一种重要方式。要精准地提供此类上下文广告就需要正确地提取聊天过程中的关键词。聊天文本不同于普通的文章,它是一种简短的文本,对...
来源:详细信息评论
基于改进向量空间模型的学术论文相似性辨别系统设计
收藏 引用
《电脑知识与技术》2009年 第7期5卷 5103-5105页
作者:谢翠香西北师范大学档案馆甘肃兰州730070 
学术腐败已日渐成为社会瞩目的焦点,除了加强科技人员道德自律,还应有相应的技术手段加以监督,由此,该文将信息检索领域中向量空间模型进行了分析改进,并用改进的模型实现了学术论文相似性辨别系统,可供一些机构用来进行学术论文...
来源:详细信息评论
基于混合特征的文本分类研究
收藏 引用
《电子设计工程》2019年 第7期27卷 61-65页
作者:黄珊珊 廖闻剑武汉邮电科学研究院湖北武汉430070 南京烽火星空通信发展有限公司江苏南京210019 
文本分类技术作为文本数据处理的一种重要手段,如何提高文本分类的效率具有重大的意义。基于传统的文本分类技术采用tfidf响了文本分类效果。本文通过对tfidf对比实验,提出了一种基于混合特征的分类方法。实验表明该方法在文本分类效果...
来源:详细信息评论
网页分类中特征选择方法的研究
收藏 引用
《电子设计工程》2016年 第5期24卷 120-122页
作者:唐喆 曹旭东中国石油大学(北京)地球物理与信息工程学院北京102249 
准确的网络分类对于健康的网络环境至关重要,本文基于这样的目的,采用了效果理想SVM分类技术,考虑到不同的特征选择方法造成的分类结果的差异,分别在相同和不同的分类样本的条件下测试了4种特征选择方法,研究得出tfidf方法的突出优点,...
来源:详细信息评论
基于KNN的烟草企业档案文本自动分类算法研究
收藏 引用
《计算机科学与应用》2014年 第9期4卷 204-216页
作者:黄世反 沈勇 康洪炜 王道红 郑见琳 郎波 王冬 贾丛丛云南大学软件学院昆明 云南省软件工程重点实验室昆明 云南省农村信用社科技结算中心昆明 
通过对云南某卷烟厂历史档案文本数据的分析研究,结合实际情况,对档案文本主题词的获取和自动分类算法进行了详细的设计。且在主题词获取算法中引入了tfidf算法,解决了档案文本缺少题名、文号及责任者项时,算法无法自动获取主题词的问...
来源:详细信息评论
突发事件网络舆情信息分类方法研究
收藏 引用
《计算机应用与软件》2010年 第5期27卷 3-5,37页
作者:郑魁 疏学明 袁宏永 金思魁中国科学技术大学火灾科学国家重点实验室安徽合肥230026 清华大学公共安全研究中心北京100084 
根据公共安全网络舆情研究的需求,将文本分类技术应用于突发事件应急管理中,提出了基于tfidf分类方法的突发事件引发的网络舆情信息分类方法,设计类别样本并读入新闻文本,对文本进行中文分词,通过计算新闻文本和类别样本的相似度将新闻...
来源:详细信息评论
聚类工具 回到顶部