限定检索结果

检索条件"作者=吕学强"
53 条 记 录,以下是1-10 订阅
视图:
排序:
基于网页内容的广告推介研究
收藏 引用
《中文信息学报》2007年 第4期21卷 42-47,54页
作者:施水才 程涛 王霞 吕学强北京信息科技大学中文信息处理研究中心北京100101 抚顺市第十五中学辽宁抚顺113006 
网页与广告关联是基于网页内容的网络广告的核心技术,本文提出了一种基于语义的、以实现网页和广告精确匹配为目标的广告推介方法。首先对一个Web网页进行主题信息提取,获得网页的主题词;然后再对这些主题词语作同义词扩展、上位词扩展...
来源:详细信息评论
广告型微博的识别方法
收藏 引用
《小型微型计算机系统》2014年 第12期35卷 2702-2707页
作者:郭跇秀 吕学强 李卓北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 
微博空间内充斥着大量广告信息,这些广告信息对舆情分析造成了极不利的影响.分析广告型微博特点,提出了一种广告型微博识别方法:在传统文本特征的基础上,引入"非活跃期微博数"、"微博重复度"、"特征词对权重&q...
来源:详细信息评论
一种工件表面压印字符识别网络
收藏 引用
《吉林大学学报(工学版)》2024年 第7期54卷 2072-2079页
作者:游新冬 郭磊 韩晶 吕学强北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 
工件表面的压印字符存在凹凸不平、锈蚀、风化等问题,导致传统的字符识别算法难以取得满意的效果。针对这一问题,将工件表面压印字符的识别视为一类特殊的目标检测问题,并针对其特性设计了一种两阶段识别网络:定位-分类网络。定位网络...
来源:详细信息评论
搜索引擎用短语词典建设
收藏 引用
《清华大学学报(自然科学版)》2005年 第S1期45卷 1892-1895页
作者:吕学强 苏祺 孙斌 俞士汶北京大学计算语言学研究所 
百度搜索引擎分词系统中的原短语库是由统计得出,含有大量噪音。委托北京大学计算语言学研究所进行了手工整理标注。为此设计了加工规范,对短语进行了严格的定义,制定了加工操作手册,并开展了手工工程,通过严格的控制保证标注的一致性...
来源:详细信息评论
机械设计图像几何特征组合检索研究
收藏 引用
《现代图书情报技术》2013年 第1期 43-49页
作者:方乃伟 吕学强 张丹北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 
基于内容的机械设计图像检索对机械设计行业有重要作用。提出一种基于几何特征组合的机械设计图像检索方法。通过机械设计图像形状区域对应的面积、周长等信息,得到7个具有不变性的几何特征如密实度、矩形度等,并将7个特征进行组合,构...
来源:详细信息评论
搜索日志中中文人名的自动识别
收藏 引用
《现代图书情报技术》2014年 第12期 71-77页
作者:曾镇 吕学强 李卓北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 
【目的】人名在搜索日志中大量存在,搜索日志中人名识别研究有助于提高搜索引擎的检索效果。【方法】提出一种搜索日志中识别中文人名的方法,首先分析日志中人名的内部组成结构以及外部上下文信息,提取7个特征,选用合适的特征模板,应用...
来源:详细信息评论
基于加权距离的机械设计图像异步检索方法
收藏 引用
《计算机应用》2013年 第5期33卷 1406-1410页
作者:方乃伟 吕学强 张丹 王弘蔚网络文化与数字传播北京市重点实验室(北京信息科技大学)北京100101 北京拓尔思信息技术股份有限公司北京100101 
根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的...
来源:详细信息评论
基于同义词词林的中文文本主题词提取
收藏 引用
《广西师范大学学报(自然科学版)》2007年 第2期25卷 145-148页
作者:程涛 施水才 王霞 吕学强北京信息科技大学中文信息处理研究中心北京100101 抚顺市第十五中学辽宁抚顺113006 
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下...
来源:详细信息评论
自由文本中汉语缩略语的自动抽取
收藏 引用
《计算机工程与设计》2014年 第4期35卷 1372-1378页
作者:张雷瀚 吕学强 李卓北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 
以汉语为对象,提出了一种从自由文本中自动抽取缩略语的方法。分析缩略语与完整形式的词性结构,提出词性模板匹配方法,获取候选缩略语与候选完整形式;根据二者之间的字面关联和共现特性,构造若干约束规则,实现候选缩略语的配对。分析缩...
来源:详细信息评论
领域本体术语抽取研究
收藏 引用
《现代图书情报技术》2014年 第1期 43-50页
作者:汤青 吕学强 李卓 施水才北京信息科技大学网络文化与数字传播北京市重点实验室北京100101 北京拓尔思信息技术股份有限公司北京100101 
【目的】尽可能多地抽取多字词本体术语,以保证本体构建的质量。【方法】提出基于部件扩展的本体术语抽取方法。利用部件的领域聚合性和词性特征,采用领域词频比较的方法抽取部件;考虑术语长度、术语词性构成以及术语内部结合度等因素,...
来源:详细信息评论
聚类工具 回到顶部