看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Mel声谱图与改进SEResNet的鱼类行为识别 收藏
基于Mel声谱图与改进SEResNet的鱼类行为识别

基于Mel声谱图与改进SEResNet的鱼类行为识别

作     者:杨雨欣 于红 杨宗轶 涂万 张鑫 林远山 YANG Yuxin;YU Hong;YANG Zongyi;TU Wan;ZHANG Xin;LIN Yuanshan

作者机构:大连海洋大学信息工程学院辽宁大连116023 大连市智慧渔业重点实验室辽宁大连116023 设施渔业教育部重点实验室(大连海洋大学)辽宁大连116023 辽宁省海洋信息技术重点实验室辽宁大连116023 

基  金:辽宁省教育厅重点科研项目“面向鱼类行为分析的声音与视觉特征融合关键技术研究(LJKZ0729)” 国家自然科学基金项目“水下实时背景下鱼类精准识别新方法研究:融合VSM和DELM(31972846)” 设施渔业教育部重点实验室开放课题“基于鱼类骨架和轨迹特征的异常行为识别方法研究(202313)” 

出 版 物:《渔业现代化》 (Fishery Modernization)

年 卷 期:2024年第51卷第1期

页      码:56-63页

摘      要:养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造成特征提取难的问题,采用高分辨率、特征表示较好的Mel声谱图以捕捉鱼类声音的频谱特征。其次针对鱼类声音特征关键信息易丢失的难题,提出在SEResNet模型中融合时序聚合池化层(Temporal Aggregated Pooling,TAP),提取池化区域的最大值和平均值,保留鱼类行为更多细粒度声音特征,提高识别准确率。为验证所提模型的有效性,分别设计了消融试验和模型性能对比试验,试验结果显示:TAP-SEResNet相比SEResNet在不降低检测速度的条件下准确率提升了3.23%;相比PANNS-CNN14、ECAPA-TDNN及MFCC+ResNet等先进声音识别模型,TAP-SEResNet在准确率上分别提升了5.32%、2.80%和1.64%。所提模型有助于养殖过程中对鱼类行为实现精准监测,对精准养殖具有重要的推动作用。

主 题 词:鱼类行为识别 被动水声信号 Mel声谱图 SEResNet 

学科分类:1305[艺术学-设计学类] 13[艺术学] 090803[090803] 0908[0908] 08[工学] 081104[081104] 09[农学] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.3969/j.issn.1007-9580.2024.01.007

馆 藏 号:203126009...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分