文献详情 >基于表示学习的中文分词算法探索收藏

基于表示学习的中文分词算法探索

作者：来斯惟徐立恒陈玉博刘康赵军 LAI Siwei;XU Liheng;CHEN Yubo;LIU Kang;ZHAO Jun

基　　金：国家自然科学基金资助项目(61070106,61272332,61202329) 国家高技术研究发展计划资助项目(863计划)(2012AA011102) 国家重点基础研究发展计划资助项目(973计划)(2012CB316300) 网络文化与数字传播北京市重点实验室开放课题资助项目(ICDD201201)

出版物：《中文信息学报》 (Journal of Chinese Information Processing)

年卷期：2013年第27卷第5期

页码：8-14页

摘要：分词是中文自然语言处理中的一个关键基础技术。通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法。然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试和修改,是一项费时费力的工作。随着基于神经网络的表示学习方法的兴起,使得自动学习特征成为可能。该文探索了一种基于表示学习的中文分词方法。首先从大规模语料中无监督地学习中文字的语义向量,然后将字的语义向量应用于基于神经网络的有监督中文分词。实验表明,表示学习算法是一种有效的中文分词方法,但是我们仍然发现,由于语料规模等的限制,表示学习方法尚不能完全取代传统基于人工设计特征的有监督机器学习方法。

主题词：表示学习中文分词

学科分类：081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类]

核心收录：

D　O　I：10.3969/j.issn.1003-0077.2013.05.002

馆藏号：203719791...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于表示学习的中文分词算法探索

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于表示学习的中文分词算法探索

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：