看过本文的还看了

相关文献

该作者的其他文献

文献详情 >计算大规模语料中四字词串互信息的算法设计 收藏
计算大规模语料中四字词串互信息的算法设计

计算大规模语料中四字词串互信息的算法设计

作     者:方莹 杨尔弘 

作者机构:山西大学太原030006 

基  金:国家 973项目 (G19980 30 5 0 1A- 0 4 )资助 

出 版 物:《电脑开发与应用》 (Computer Development & Applications)

年 卷 期:2005年第18卷第1期

页      码:2-3,6页

摘      要:中文信息处理中 ,判断哪些词串该入选《分词词表》一直是一个难题。互信息作为一种衡量手段 ,在一定程度上体现了词串的各组成部分之间结合的紧密程度 ,以北京大学 1998年 1月《人民日报》标注语料为试验料 ,通过互信息的计算分析四字词串成词的可能性 。

主 题 词:互信息 大规模 算法设计 中文信息处理 词表 语料 分词 《人民日报》 北京大学 难题 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081203[081203] 08[工学] 0835[0835] 081201[081201] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1003-5850.2005.01.006

馆 藏 号:203986383...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分