限定检索结果

检索条件"主题词=视听相关性"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于多尺度自适应注意力机制的视听语音分离
收藏 引用
《人工智能》2024年 第3期 1-14页
作者:吴亮 王甲祥 施汉琴 郑爱华 盛小飞安徽大学计算机科学与技术学院合肥230601 徐州工程学院信息工程学院江苏徐州221000 安徽大学人工智能学院合肥230601 芜湖辛巴网络科技有限公司安徽芜湖241002 
在混合音频分离过程中,通常使用与音频信息相关的视觉信息引导混合音频分离,这些视觉信息包含人脸图像、嘴唇运动和面部地标等,目前的方法对这些视觉信息的利用还不充分,并且音频信息和对应的视觉信息之间的关联较弱。本工作设计了一...
来源:详细信息评论
聚类工具 回到顶部