限定检索结果

检索条件"主题词=上下文熵"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于Spark的中文新词提取
收藏 引用
《计算机工程与设计》2017年 第11期38卷 3185-3191页
作者:丁祥武 张东辉东华大学计算机科学与技术学院上海201620 
为提高新词提取的准确率,根据新词在时间上的性质引入时间频率函数值特征,提出自动阈值获取算法。针对高处理效率特性,基于Spark平台对海量语料库中新词提取方案进行研究,提出一种分布式新词提取方案。对文本预处理,统计文本中字串的特...
来源:详细信息评论
聚类工具 回到顶部