文献检索-宁波市创意产业特色资源库

视频描述中全局-局部联合语义生成网络: 收藏
分享
引用; 《计算机辅助设计与图形学学报》2023年第9期35卷 1374-1382页; 作者：毛琳高航杨大伟大连民族大学机电工程学院大连116600; 针对视频描述中语义特征不能兼顾全局概括信息和局部细节信息,影响视频描述效果的问题,提出一种视频描述中全局-局部联合语义生成网络GLS-Net.首先利用全局与局部信息的互补性设计全局和局部语义提取单元,2个单元采用残差结构的多层感知...; 针对视频描述中语义特征不能兼顾全局概括信息和局部细节信息,影响视频描述效果的问题,提出一种视频描述中全局-局部联合语义生成网络GLS-Net.首先利用全局与局部信息的互补性设计全局和局部语义提取单元,2个单元采用残差结构的多层感知机(residual multi-layer perceptron,r-MLP)来增强特征提取效果;然后联合概括性全局语义和细节性局部语义增强语义特征的表达能力;最后将该语义特征作为视频内容编码,提升视频描述模型性能.在MSR-VTT和MSVD数据集上,以语义辅助视频描述(semantics-assisted video captioning network,SAVC)网络为基础进行的实验的结果表明,GLS-Net优于现有同类算法,与SAVC网络相比,准确率平均提升6.2%.; 来源：详细信息评论

语言结构引导的可解释视频语义描述: 收藏
分享
引用; 《软件学报》2023年第12期34卷 5905-5920页; 作者：李冠彬张锐斐刘梦梦刘劲林倞中山大学计算机学院广东广州510006 人工智能与数字经济广东省实验室(广州)广东广州510320; 视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一...; 视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一直是视频描述工作的研究重点和难点.另一方面,大多数现有工作都将句子视为一个链状结构,并将视频描述任务视为一个生成单词序列的过程,而忽略了句子的语义结构,这使得算法难以应对和优化复杂的句子描述及长句子中易引起的逻辑错误.为了解决上述问题,提出一种新颖的语言结构引导的可解释视频语义描述生成方法,通过设计一个基于注意力的结构化小管定位机制,充分考虑局部对象信息和句子语义结构.结合句子的语法分析树,所提方法能够自适应地加入具有文本内容的相应时空特征,进一步提升视频描述的生成效果.在主流的视频描述任务基准数据集MSVD和MSR-VTT上的实验结果表明,所提出方法在大多数评价指标上都达到了最先进的水平.; 来源：详细信息评论

基于场景表示中对象特征语法分析的视频描述: 收藏
分享
引用; 《计算机工程与设计》2023年第2期44卷 488-493页; 作者：付燕王咪咪叶鸥西安科技大学计算机科学与技术学院陕西西安710054; 为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析,造成描述语句语法结构不清晰的问题,提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合,构建视觉场...; 为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析,造成描述语句语法结构不清晰的问题,提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合,构建视觉场景表示模型,描述视觉特征间的依赖关系;构建视觉对象特征语法分析模型,分析对象特征在描述语句中的语法成分;解码阶段结合语法分析结果和LSTM网络模型,输出视频描述语句。所提方法在MSVD和MSR-VTT数据集进行实验,结果表明,该方法在不同评价指标方面性能较好,视频描述语句的语法结构清晰。; 来源：详细信息评论

基于多模态信息的视频描述算法: 收藏
分享
引用; 《信息技术与网络安全》2019年第7期38卷 47-53,71页; 作者：孙亮中国科学技术大学信息科学技术学院; 为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和高级语义属性。在编码器阶段,提取视频的静态特征、光流特征和视频段特征,同时设计语义属性检测网络得到...; 为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和高级语义属性。在编码器阶段,提取视频的静态特征、光流特征和视频段特征,同时设计语义属性检测网络得到视频高级语义特征。为了避免解码器阶段的曝光偏差和训练损失与评价准则不统一的问题,采用基于强化学习的训练算法直接将客观评价准则作为优化目标来训练模型。所提出的算法在公开视频描述数据集MSVD上取得了很好的实验效果。; 来源：详细信息评论

基于在线视频描述的视障人士辅助系统: 收藏
分享
引用; 《计算机时代》2022年第9期 23-27页; 作者：陈冰萸杭州电子科技大学计算机学院浙江杭州310018; 针对已有的视频描述技术还难以实现在线作业的现状,提出一种基于注意力机制的、能够实现在线视频描述的视障人士辅助系统。视障人士可在系统中实时上传视频,或通过手机摄像头获取视频信息,系统便会将视频内容转化为文字描述,并通过语音...; 针对已有的视频描述技术还难以实现在线作业的现状,提出一种基于注意力机制的、能够实现在线视频描述的视障人士辅助系统。视障人士可在系统中实时上传视频,或通过手机摄像头获取视频信息,系统便会将视频内容转化为文字描述,并通过语音反馈给观影者,起到辅助提醒的作用,从而辅助提高视障人士的生活体验。; 来源：详细信息评论

关系挖掘驱动的视频描述自动生成: 收藏
分享
引用; 《南京信息工程大学学报（自然科学版）》2017年第6期9卷 642-649页; 作者：黄毅鲍秉坤徐常胜中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院大学北京100049; 视频的自动描述任务是计算机视觉领域的一个热点问题.视频描述语句的生成过程需要自然语言处理的知识,并且能够满足输入(视频帧序列)和输出(文本词序列)的长度可变.为此本文结合了最近机器翻译领域取得的进展,设计了基于编码-解码框架...; 视频的自动描述任务是计算机视觉领域的一个热点问题.视频描述语句的生成过程需要自然语言处理的知识,并且能够满足输入(视频帧序列)和输出(文本词序列)的长度可变.为此本文结合了最近机器翻译领域取得的进展,设计了基于编码-解码框架的双层LSTM模型.在实验过程中,本文基于构建深度学习框架时重要的表示学习思想,利用卷积神经网络(CNN)提取视频帧的特征向量作为序列转换模型的输入,并比较了不同特征提取方法下对双层LSTM视频描述模型的影响.实验结果表明,本文的模型具有学习序列知识并转化为文本表示的能力.; 来源：详细信息评论

感知词性信息的动作检测在视频描述中的应用: 收藏
分享
引用; 《福建电脑》2022年第6期38卷 95-98页; 作者：张一丁蒋昕怡史晓颖杭州电子科技大学计算机学院杭州310018; 针对现有视频描述模型的缺陷,本文探讨设计了感知词性信息的动作检测的视频描述模型。首先对视频中的场景进行特征提取,再利用动作检测模块判断视频中多个物体间的全局依赖关系来确定主语物体,并结合主语类别和视频动态特征预测动作,以...; 针对现有视频描述模型的缺陷,本文探讨设计了感知词性信息的动作检测的视频描述模型。首先对视频中的场景进行特征提取,再利用动作检测模块判断视频中多个物体间的全局依赖关系来确定主语物体,并结合主语类别和视频动态特征预测动作,以得到更准确的词性信息,最后通过语法引导的描述器生成更精确的场景描述语句。此模型在实时推断的基础上提升准确率,若将其应用在导航中,能识别分析周围交通状况及路况信息并生成自然语言描述,可以为视障人群指引方向,保障视障人士出行的安全性和便利性。; 来源：详细信息评论

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案：

收藏书架

请选择收藏分类：

检索条件订阅

申请转借

引用

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

限定检索结果

保存检索档案

请选择保存的检索档案： 新增检索档案 确定 取消

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

检索条件订阅

申请转借

引用

高级检索表达式检索

高级检索表达式检索

请选择保存的检索档案：

请选择收藏分类：