T=题名(书名、题名),A=作者(责任者),K=主题词,P=出版物名称,PU=出版社名称,O=机构(作者单位、学位授予单位、专利申请人),L=中图分类号,C=学科分类号,U=全部字段,Y=年(出版发行年、学位年度、标准发布年)
AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
范例一:(K=图书馆学 OR K=情报学) AND A=范并思 AND Y=1982-2016
范例二:P=计算机应用与软件 AND (U=C++ OR U=Basic) NOT K=Visual AND Y=2011-2016
摘要:为了解决带混响和噪声场景下的语音增强问题,构建了一个集成多通道线性预测模型和空间相干模型的语音增强模型,设计了一种基于混合混响模型的多通道语音增强算法。该算法将后期混响分为2个分量,分别用多通道线性预测模型和空间相干模型来建模,为优化模型参数,利用卡尔曼滤波器实施更新模型参数,并用多项式矩阵特征值分解进行空间、时间和频率解相关,实现去混响去噪声。实验结果表明,所提算法可以实现高低混响带噪声环境下的语音增强,相比于流行的语音增强算法,其增强效果更优越,其中语音质量客观评价(PESQ)值和短时客观可懂度(STOI)值最高分别提高了30%和20%。
摘要:为了解决高混响环境下欠定卷积混叠信号的分离问题,提出一种新的欠定卷积盲源分离算法。针对高混响环境的影响,设计全局脉冲响应网络削弱混响回声,提高信号质量。基于全局脉冲响应网络建立新的时频域混叠信号数学模型,采用全局脉冲响应矩阵缩短了传统脉冲响应的长度,降低了高混响带来的模型变换近似误差。基于非负矩阵分解理论设计模型参数的实时更新学习规则,将源信号分离问题转换为模型参数优化问题,实现混叠信号的盲源分离。实验结果表明,所提算法可以有效地实现中英文语音、音乐混叠信号的盲源分离,与现有比较流行的盲源分离算法的对比验证了所提算法的优越性。
摘要:二值离焦技术在高速动态三维测量中展现出巨大优势。然而,离焦投影模式决定了其仅能在合适离焦程度才可得到高质量测量结果,导致测量深度十分受限。为扩大测量深度,提出一种深度学习驱动的二值聚焦投影三维测量方法。利用聚焦投影策略,无须考虑图像离焦带来的条纹成像影响,从根本上克服二值离焦技术的局限性。其次,设计了两阶段深度学习框架对二值条纹进行处理:其中对抗式学习实现全测量深度内的高质量正弦条纹生成;分支残差学习输出条纹级数辅助相位展开,减小传统离焦投影引起的级数边缘误差。实验结果表明,所提方法可显著扩大测量深度范围,且保证全范围高质量三维重建结果。
摘要:虽然深度神经网络模型的性能十分出色,但目前网络存在规模庞大、权重冗余度高的问题。同时,现有对网络权重剪枝的正则子估测偏差大。因此,本文提出无偏稀疏正则化的双策略结构神经网络压缩。首先,本文将神经网络所连接权重视为一组,提出采用估测值偏差小的非线性拉普拉斯函数,构建组间无偏结构稀疏正则子和组内无偏结构稀疏正则子,对冗余神经元和剩余神经元的冗余权重分别进行稀疏约束,构建无偏稀疏正则化的双策略结构神经网络压缩模型。其次,针对所设计的无偏稀疏正则化的网络压缩优化难题,本文采用近端算子技术获得无偏稀疏正则子的闭式解,进而设计基于近端梯度下降法的反向传播算法,实现神经网络准确的结构压缩。最后,通过在数据集MNIST、FashionMNIST和Cifar-10进行实验验证,本文所提出的无偏稀疏正则子的双策略结构神经网络压缩不仅收敛速度快于目前主流正则子。而且在压缩率保持一致的情况下,相比已有的方法识别精度平均提升2.3%,在识别保持精度基本一致的情况下,相对已有方法平均提升11.5%的压缩率。
摘要:环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。
摘要:自动导引车(Automated Guided Vehicle,AGV)的自主路径规划是离散制造智能工厂中物流系统的重要组成部分,AGV可以大大提高离散智能制造的智能化和自动化能力,而传统的AGV导航方式自由度较低。本文研究面向离散制造智能工厂场景下的AGV自主路径规划问题,应用深度强化学习方法提高自主路径规划的自由度。设计了一种多模态环境信息感知的神经网络结构,并将AGV在全局障碍下的路径规划预训练策略引入到复杂的离散制造智能工厂场景下的路径规划,实现了AGV从环境感知到动作决策的端到端路径规划。实验结果表明,采用本文提出算法的AGV能够在复杂的离散制造智能工厂环境进行自主规划路径,并具有较高的成功率和避障能力。
摘要:核磁共振成像(Magnetic Resonance Imaging,MRI)通过高分辨率目标组织扫描,可以使医生和患者在免于电离辐射的情况下实现实时成像。近年来,科学家和工程师们一直尝试将机器人技术与MRI结合在一起,实现机器人辅助和图像引导相结合的诊断及治疗。本文介绍了可用于术中MRI的医疗机器人系统,具体包括它们的成像兼容性、驱动方式、传感方式、运动学以及机械和电气设计,这些技术使得机器人在MRI引导下的介入诊疗成为可能,此外,基于不同的医学场景,本文对各种MR兼容机器人系统做了分类和比较研究,最后对MR兼容机器人领域的未来发展方向进行了展望。
地址:宁波市钱湖南路8号浙江万里学院(315100)
Tel:0574-88222222
招生:0574-88222065 88222066
Email:yzb@zwu.edu.cn