看过本文的还看了

相关文献

该作者的其他文献

文献详情 >利用prefix-hash-tree实现从中文文本到事务数据的转换 收藏
利用prefix-hash-tree实现从中文文本到事务数据的转换

利用prefix-hash-tree实现从中文文本到事务数据的转换

作     者:钱铁云 王元珍 冯小年 QIAN Tie-Yun;WANG Yuan-Zhen;FENG Xiao-Nian

作者机构:华中科技大学计算机学院数据库与多媒体技术研究所武汉430074 中国电力财务有限公司华中分公司武汉430077 

基  金:科技部科技电子政务系统关键技术及应用系统的研究(项目编号2001BA110B01)资助 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2005年第32卷第5期

页      码:167-169,184页

摘      要:电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hash-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率。

主 题 词:中文文本 hash 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联 

学科分类:081203[081203] 0839[0839] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3969/j.issn.1002-137X.2005.05.046

馆 藏 号:203120843...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分