文献详情 >基于可信度的中文完整词自动识别收藏

基于可信度的中文完整词自动识别

作者：王芳万常选 WANG Fang;WAN Changxuan

作者机构：江西财经大学信息管理学院江西南昌330013 江西财经大学数据与知识工程江西省高校重点实验室江西南昌330013 南昌大学人文学院江西南昌330031

基　　金：国家自然科学基金资助项目(60763001) 江西省自然科学基金资助项目(2007GZS0082)

出版物：《中文信息学报》 (Journal of Chinese Information Processing)

年卷期：2009年第23卷第3期

页码：17-23页

摘要：中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。

主题词：计算机应用中文信息处理中文分词互信息可信度自动识别

学科分类：081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类]

核心收录：

D　O　I：10.3969/j.issn.1003-0077.2009.03.003

馆藏号：203433884...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于可信度的中文完整词自动识别

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于可信度的中文完整词自动识别

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：