限定检索结果

检索条件"作者=薛化建"
4 条 记 录,以下是1-10 订阅
视图:
排序:
维吾尔文网页正文抽取系统的研究与实现
收藏 引用
《计算机工程与设计》2012年 第2期33卷 551-555页
作者:蔡李 单艳 薛化建 苏国平中国科学院新疆理化技术研究所新疆乌鲁木齐830011 中国科学院研究生院北京100049 新疆维吾尔自治区经济和信息化委员会新疆乌鲁木齐830011 
从构大规模维吾尔文语料库的角度出发,归纳总结各类网页正文抽取技术,提出一种基于文本句长特征的网页正文抽取方法。该方法定义一系列过滤和替换规则对网页源码进行预处理,根据文本句长特征来判断文本段是否为网页正文。整个处理过...
来源:详细信息评论
维吾尔语语音识别语料库中的OOV研究
收藏 引用
《计算机工程与设计》2012年 第2期33卷 772-776页
作者:张小燕 宿 薛化建 王磊中国科学院新疆理化技术研究所新疆乌鲁木齐830011 中国科学院研究生院北京100049 
鉴于维吾尔语丰富的形态变产生大量单词引起的集外词(out of vocabulary,OOV)问题,为了定量研究OOV对维吾尔语语音识别的影响,采用控制语料库测试集OOV的算法及最佳文本挑选算法对不同OOV的测试集进行实验,算法通过Python语言实现。...
来源:详细信息评论
基于子字单元的维吾尔语语音识别研究
收藏 引用
《计算机工程》2011年 第20期37卷 208-210页
作者:薛化建 董兴华 周喜 吐尔洪.吾司曼 李晓中国科学院新疆理化技术研究所乌鲁木齐830011 中国科学院研究生院北京100190 
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构子字发音字典的方法,及其以子字单元为基础构语言模型与声学模型的方法。在一个...
来源:详细信息评论
基于词缀库的非监督维吾尔语词切分方法
收藏 引用
《计算机工程与设计》2011年 第9期32卷 3191-3194页
作者:薛化建 董兴华 王磊 吐尔洪.吾司曼 蒋同海中国科学院新疆理化技术研究所新疆乌鲁木齐830011 中国科学院研究生院北京100049 
在维吾尔语中,词缀的数量有限且构词具有一定的规律性。为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维吾尔语词切分方法。该方法对词进行规则切分,采用MAP切分评价...
来源:详细信息评论
聚类工具 回到顶部