文献检索-宁波市创意产业特色资源库

限定检索结果

检索条件"作者=施汉琴"

共 2 条记录，以下是1-10 订阅

全选清除本页清除全部题录导出标记到"检索档案"

视图：

排序：

基于多尺度自适应注意力机制的视听语音分离: 收藏
分享
引用; 《人工智能》2024年第3期 1-14页; 作者：吴亮王甲祥施汉琴郑爱华盛小飞安徽大学计算机科学与技术学院合肥230601 徐州工程学院信息工程学院江苏徐州221000 安徽大学人工智能学院合肥230601 芜湖辛巴网络科技有限公司安徽芜湖241002; 在混合音频分离过程中,通常使用与音频信息相关的视觉信息引导混合音频分离,这些视觉信息包含人脸图像、嘴唇运动和面部地标等,目前的方法对这些视觉信息的利用还不充分,并且音频信息和对应的视觉信息之间的关联性较弱。本工作设计了一...; 在混合音频分离过程中,通常使用与音频信息相关的视觉信息引导混合音频分离,这些视觉信息包含人脸图像、嘴唇运动和面部地标等,目前的方法对这些视觉信息的利用还不充分,并且音频信息和对应的视觉信息之间的关联性较弱。本工作设计了一种基于多尺度自适应注意力机制的视听语音分离网络,该网络联合人脸图像、嘴唇运动和面部地标这些视觉信息引导混合音频进行分离,并设计了一种交叉注意融合模块,该模块可以融合嘴唇运动特征和面部地标特征以得到增强且互补的视觉表示。此外,音频信息和视觉信息之间的相关性较弱,本文还设计了一种多尺度自适应注意力机制,并将其加入语音分离网络解码器中,使音频信息和对应的视觉信息更好地相互关联。实验结果验证了该方法的有效性。; 来源：详细信息评论

采用稀疏和平滑双约束的增量正交映射非负矩阵分解目标跟踪: 收藏
分享
引用; 《计算机辅助设计与图形学学报》2017年第9期29卷 1658-1666页; 作者：王华彬田猛周健施汉琴陶亮安徽大学计算智能与信号处理教育部重点实验室合肥230039 安徽大学媒体计算研究所合肥230601; 针对目标跟踪在遮挡和尺度变化等复杂背景下跟踪性能下降问题,联合稀疏约束、时间平滑约束以及增量投影非负矩阵分解,提出一种在线目标跟踪算法.首先利用非负矩阵分解学习一个基于部分表示的子空间,在此基础上添加稀疏约束提高处理遮挡...; 针对目标跟踪在遮挡和尺度变化等复杂背景下跟踪性能下降问题,联合稀疏约束、时间平滑约束以及增量投影非负矩阵分解,提出一种在线目标跟踪算法.首先利用非负矩阵分解学习一个基于部分表示的子空间,在此基础上添加稀疏约束提高处理遮挡能力,添加时间平滑约束提高算法的稳定性;然后用增量方式完成子空间的在线更新,减少算法计算量、提高外观模型更新效率;最后在粒子滤波框架下,以重构误差为基础改进了观测似然函数,将具有最大后验概率的候选目标作为目标在当前帧的图像区域.实验结果表明,在各种含有遮挡和尺度变化的视频中,该算法可以更稳定地跟踪目标.; 来源：详细信息评论

全选清除本页清除全部题录导出标记到“检索档案”

共1页<< <1> >>

聚类工具回到顶部