看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 收藏
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现

基于LDA模型融合Catboost算法的文本自动分类系统设计与实现

作     者:刘爱琴 郭少鹏 张卓星 Liu Aiqin;Guo Shaopeng;Zhang Zhuoxing

作者机构:山西大学经济与管理学院 

出 版 物:《国家图书馆学刊》 (Journal of The National Library of China)

年 卷 期:2023年第32卷第5期

页      码:84-92页

摘      要:互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。

主 题 词:隐含狄利克雷分布(LDA) 文本自动分类 SVM算法 Catboost算法 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.13666/j.cnki.jnlc.2023.0508

馆 藏 号:203124195...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分