看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于递归自编码器的广告短语相关性 收藏
基于递归自编码器的广告短语相关性

基于递归自编码器的广告短语相关性

作     者:胡庆辉 魏士伟 解忠乾 任亚峰 HU Qinghui;WEI Shiwei;XIE Zhongqian;REN Yafeng

作者机构:武汉大学计算机学院武汉430072 桂林航天工业学院广西高校机器人与焊接技术重点实验室培育基地广西桂林541004 

基  金:国家自然科学基金资助项目(11301106) 广西自然科学基金资助项目(2014GXNSFAA1183105) 广西高校科研资助项目(ZD2014147 YB2014431)~~ 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2016年第36卷第1期

页      码:154-157,187页

摘      要:针对现有广告短语相关性研究成果多采用字面匹配,忽略了短语所包含的深层语义信息,限制了任务的性能等问题,提出了采用深度学习算法研究广告短语的相关性,采用递归自编码器(RAE)对短语进行深层结构分析,使得短语向量包含深层的语义信息,以此来构建广告语境下的短语相关性计算方法。具体地,给定一个包含若干词的序列,序列中所有相邻的两个元素尝试合并产生一个重构误差,遍历将重构误差最小的元素两两合并,形成类似哈夫曼树结构的短语树。采用梯度下降法最小化短语树的重构误差,采用余弦距离度量短语之间的相关性。实验结果显示,通过引入词语权重信息,加大了重要词语在最终短语向量表示中贡献的信息量,使得RAE更适合短语计算;比起传统LDA和BM25算法,在50%召回率的条件下,提出的算法的准确率分别提高了4.59个百分点和3.21个百分点,这证明了所提算法的有效性。

主 题 词:深度学习 递归自编码器 词向量 计算广告 搜索引擎 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081203[081203] 08[工学] 081104[081104] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2016.01.0154

馆 藏 号:203705496...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分