看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向Web的藏文文本分词策略研究 收藏
面向Web的藏文文本分词策略研究

面向Web的藏文文本分词策略研究

作     者:艾金勇 陈小莹 华侃 

作者机构:西藏民族学院图书馆 西藏民族学院信息工程学院 西北民族大学藏语言文化学院 

基  金:教育部人文社科一般项目"网络环境下特定主题的藏文信息发现与采集方法研究"(No:13XZJC870001)的阶段性成果 

出 版 物:《图书馆学研究》 (Research on Library Science)

年 卷 期:2014年第21期

页      码:42-46页

摘      要:文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开发了一个面向藏文网页的自动分词系统。该系统结合藏语语句特点,首先利用特征词进行了文本分块,然后对语块内文本综合运用统计与词典匹配的方法实现了藏文的自动分词。实验测试结果表明该系统明显提升了Web文本的分词效果。

主 题 词:藏文 特征词 Web 自动分词 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 120501[120501] 120502[120502] 

核心收录:

D O I:10.15941/j.cnki.issn1001-0424.2014.21.009

馆 藏 号:203131986...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分