看过本文的还看了

相关文献

该作者的其他文献

文献详情 >胸部X线影像和诊断报告的双塔跨模态检索 收藏
胸部X线影像和诊断报告的双塔跨模态检索

胸部X线影像和诊断报告的双塔跨模态检索

作     者:张嘉诚 欧卫华 陈英杰 张文川 熊嘉豪 Zhang Jiacheng;Ou Weihua;Chen Yingjie;Zhang Wenchuan;Xiong Jiahao

作者机构:贵州师范大学数学科学学院贵阳550025 贵州师范大学大数据与计算机科学学院贵阳550025 

基  金:国家自然科学基金资助项目(62262005 61962010) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2023年第40卷第8期

页      码:2543-2548页

摘      要:针对现有胸部X线影像和诊断报告跨模态方法重点聚焦于全局信息对齐,忽视了影像和诊断报告间的细粒度语义关联,导致检索精度低、匹配度差的问题,提出全局和局部联合对齐的胸部X线影像和诊断报告双塔跨模态检索方法(CDTCR)。具体来说,针对细粒度语义表征,提出由残差网络组成的影像编码器学习影像的细粒度特征和由Transformer构成的BERT模型学习诊断报告的细粒度语义特征;针对细粒度语义关联问题,设计影像对句子和区域对词组两个不同粒度的模态间信息对齐策略,解决了不同模态间细粒度语义关联不足的问题。大型医学数据集MIMIC-CXR上的实验结果表明,CDTCR比现有的跨模态检索方法,检索精度更高、可解释性更强。

主 题 词:胸部X线影像 双塔跨模态检索 细粒度 Transformer BERT 

学科分类:08[工学] 081202[081202] 0812[工学-测绘类] 

D O I:10.19734/j.issn.1001-3695.2022.12.0786

馆 藏 号:203122708...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分