限定检索结果

检索条件"作者=施汉琴"
2 条 记 录,以下是1-10 订阅
视图:
排序:
基于多尺度自适应注意力机制的视听语音分离
收藏 引用
《人工智能》2024年 第3期 1-14页
作者:吴亮 王甲祥 施汉琴 郑爱华 盛小飞安徽大学计算机科学与技术学院合肥230601 徐州工程学院信息工程学院江苏徐州221000 安徽大学人工智能学院合肥230601 芜湖辛巴网络科技有限公司安徽芜湖241002 
在混合音频分离过程中,通常使用与音频信息相关的视觉信息引导混合音频分离,这些视觉信息包含人脸图像、嘴唇运动和面部地标等,目前的方法对这些视觉信息的利用还不充分,并且音频信息和对应的视觉信息之间的关联性较弱。本工作设计了一...
来源:详细信息评论
采用稀疏和平滑双约束的增量正交映射非负矩阵分解目标跟踪
收藏 引用
《计算机辅助设计与图形学学报》2017年 第9期29卷 1658-1666页
作者:王华彬 田猛 周健 施汉琴 陶亮安徽大学计算智能与信号处理教育部重点实验室合肥230039 安徽大学媒体计算研究所合肥230601 
针对目标跟踪在遮挡和尺度变化等复杂背景下跟踪性能下降问题,联合稀疏约束、时间平滑约束以及增量投影非负矩阵分解,提出一种在线目标跟踪算法.首先利用非负矩阵分解学习一个基于部分表示的子空间,在此基础上添加稀疏约束提高处理遮挡...
来源:详细信息评论
聚类工具 回到顶部