限定检索结果

检索条件"主题词=视频描述"
7 条 记 录,以下是1-10 订阅
视图:
排序:
视频描述中全局-局部联合语义生成网络
收藏 引用
《计算机辅助设计与图形学学报》2023年 第9期35卷 1374-1382页
作者:毛琳 高航 杨大伟大连民族大学机电工程学院大连116600 
针对视频描述中语义特征不能兼顾全局概括信息和局部细节信息,影响视频描述效果的问题,提出一种视频描述中全局-局部联合语义生成网络GLS-Net.首先利用全局与局部信息的互补性设计全局和局部语义提取单元,2个单元采用残差结构的多层感知...
来源:详细信息评论
语言结构引导的可解释视频语义描述
收藏 引用
《软件学报》2023年 第12期34卷 5905-5920页
作者:李冠彬 张锐斐 刘梦梦 刘劲 林倞中山大学计算机学院广东广州510006 人工智能与数字经济广东省实验室(广州)广东广州510320 
视频描述技术旨在为视频自动生成包含丰富内容的文字描述,近年来吸引了广泛的研究兴趣.一个准确而精细的视频描述生成方法,不仅需要对视频有全局上的理解,更离不开具体显著目标的局部空间和时序特征.如何建模一个更优的视频特征表达,一...
来源:详细信息评论
基于场景表示中对象特征语法分析的视频描述
收藏 引用
《计算机工程与设计》2023年 第2期44卷 488-493页
作者:付燕 王咪咪 叶鸥西安科技大学计算机科学与技术学院陕西西安710054 
为解决基于编码器-解码器的视频描述方法中存在忽略特征语法分析,造成描述语句语法结构不清晰的问题,提出一种基于场景表示中对象特征语法分析的视频描述方法。编码阶段将视频的2D、C3D特征、对象特征和自注意力机制相结合,构建视觉场...
来源:详细信息评论
基于多模态信息的视频描述算法
收藏 引用
《信息技术与网络安全》2019年 第7期38卷 47-53,71页
作者:孙亮中国科学技术大学信息科学技术学院 
为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和高级语义属性。在编码器阶段,提取视频的静态特征、光流特征和视频段特征,同时设计语义属性检测网络得到...
来源:详细信息评论
基于在线视频描述的视障人士辅助系统
收藏 引用
《计算机时代》2022年 第9期 23-27页
作者:陈冰萸杭州电子科技大学计算机学院浙江杭州310018 
针对已有的视频描述技术还难以实现在线作业的现状,提出一种基于注意力机制的、能够实现在线视频描述的视障人士辅助系统。视障人士可在系统中实时上传视频,或通过手机摄像头获取视频信息,系统便会将视频内容转化为文字描述,并通过语音...
来源:详细信息评论
关系挖掘驱动的视频描述自动生成
收藏 引用
《南京信息工程大学学报(自然科学版)》2017年 第6期9卷 642-649页
作者:黄毅 鲍秉坤 徐常胜中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院大学北京100049 
视频的自动描述任务是计算机视觉领域的一个热点问题.视频描述语句的生成过程需要自然语言处理的知识,并且能够满足输入(视频帧序列)和输出(文本词序列)的长度可变.为此本文结合了最近机器翻译领域取得的进展,设计了基于编码-解码框架...
来源:详细信息评论
感知词性信息的动作检测在视频描述中的应用
收藏 引用
《福建电脑》2022年 第6期38卷 95-98页
作者:张一丁 蒋昕怡 史晓颖杭州电子科技大学计算机学院杭州310018 
针对现有视频描述模型的缺陷,本文探讨设计了感知词性信息的动作检测的视频描述模型。首先对视频中的场景进行特征提取,再利用动作检测模块判断视频中多个物体间的全局依赖关系来确定主语物体,并结合主语类别和视频动态特征预测动作,以...
来源:详细信息评论
聚类工具 回到顶部