网站首页 > 博客文章 正文
YOLO-OB: An improved anchor-free real-time multiscale colon polyp detector in colonoscopy
Github:https://github.com/seanyan62/YOLO-OB
标题:YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器
摘要:结肠癌预计将在2023年成为美国第二大癌症死因。尽管结肠镜检查是早期预防结肠癌最有效的方法之一,但最多有30%的息肉可能被内窥镜医生忽略,从而增加患者患结肠癌的风险。虽然深度神经网络已被证明是提高息肉检测率的有效手段。然而,息肉大小的变化带来以下问题:(1)很难设计一个高效且充分的多尺度特征融合结构;(2)使用固定大小的锚定框匹配不同大小的息肉是一个困难的挑战。这些问题降低了息肉检测的性能,同时降低了模型的训练和检测效率。为了解决这些挑战,本文提出了一个名为YOLO-OB的新模型。具体而言,我们开发了一个双向多尺度特征融合结构BiSPFPN,可以增强卷积神经网络在不同深度之间的特征融合能力。我们采用了ObjectBox检测头,该头部使用基于中心的无锚定盒回归策略,可以在任何尺度的特征图上检测到不同大小的息肉。在公共数据集SUN和自采集的结肠息肉数据集Union上的实验证明,所提出的模型显著提高了息肉检测的各种性能指标,尤其是召回率。与公共数据集SUN上的最先进结果相比,所提出的方法使召回率从91.5%增加到98.23%,提高了6.73%。此外,我们的YOLO-OB能够使用RTX3090显卡以每秒39帧的速度实现实时息肉检测。
解决的问题:
该论文要解决的问题是在结肠镜检查中,提高多尺度结肠息肉检测的准确性和实时性,同时避免使用锚点。通过应用YOLO-OB(一种改进的锚点自由实时多尺度结肠息肉检测器),该论文旨在解决现有技术中息肉检测的挑战,包括检测率不高、实时性不足以及需要手动设置锚点等问题。通过提高检测准确性和实时性,以及消除对锚点的依赖,该论文旨在推动结肠息肉检测技术的进步,从而有助于更早地发现并治疗结肠癌。
创新点:
- 提出了一种新的多尺度特征融合结构,即BiSPFPN,以增强CNN不同深度的特征融合能力。通过双向特征融合,该结构能够更好地捕捉到不同尺度的特征信息,从而提高模型对不同大小息肉的检测能力。
- 提出了YOLO-OB模型,通过改进YOLO系列算法,解决了多尺度检测问题。该模型能够在不同的输入尺度下,提高模型的检测精度和鲁棒性。
- 针对多尺度检测问题,引入了数据增强技术,通过对图像进行随机缩放和翻转,增加了模型的泛化能力。
- 设计了一种新的检测头模块,通过引入注意力机制和多尺度特征融合,提高了模型对息肉的识别精度和鲁棒性。
系统架构:
结果:
结论:
基于YOLO系列算法的基本框架,本文提出了一种称为YOLO-OB的息肉检测模型。与当前最先进的模型相比,我们的模型能够有效提高息肉检测的召回率。我们专注于多尺度检测问题,并在几个方面进行了改进:数据增强、多尺度特征融合和检测头模块。为验证模型的泛化性能,我们手动标注了从不同医院收集的结肠息肉数据集Union,以进一步扩展训练和测试样本。
在数据预处理方面,我们使用马赛克数据增强手动构建了更多多样尺寸的训练样本。对于特征融合,我们采用了多分辨率检测方法,并使用DarkNet53中不同深度的特征图实现多尺度息肉检测。我们还设计了一个BiSPFPN层,以有效融合骨干网络不同深度的特征图。为了提高检测头的性能,我们设计了一种基于ObjectBox的无锚定盒回归方法。
我们提出的模型在公共数据集SUN和私有数据集Union上均取得了高性能。YOLO-OB在RTX3090上能够以每秒39帧的速度实现实时息肉检测,在GTX1080Ti显卡上为每秒29帧。因此,它可以应用于实时结肠镜CAD系统,帮助医生检测结肠息肉。这项工作的实施可以减少漏诊息肉的发生,从而降低患者患结肠癌的风险。
实际应用价值:
- 改进了检测算法:该论文提出了一种新的盒回归策略,可以更准确地检测目标物体。这种策略在每个特征图上只使用包含目标中心(蓝色单元格)的单元格来回归边界框,而将其他特征单元格标记为负样本。这种方法可以显著提高目标检测的准确性,特别是在处理不同尺度的目标时。
- 提高了模型的泛化能力:通过在每个特征图上获取三个正样本点,该策略能够让每个特征图都具有预测不同尺度对象的能力。这使得模型能够更好地适应各种应用场景,提高了模型的泛化能力。
- 促进了医学影像分析:该论文的方法可以应用于医学影像分析中,特别是在内窥镜视频流中检测息肉等病变。通过使用该论文的方法,可以更准确地检测病变,提高医学影像分析的准确性和效率。
- 推动了深度学习在计算机视觉领域的发展:该论文的方法是一种深度学习算法,可以应用于计算机视觉领域的各种任务中。该方法的应用不仅提高了目标检测的准确性,也为其他计算机视觉任务提供了新的思路和方法。
猜你喜欢
- 2024-10-21 基于多尺度残差收缩网络的遥感图像分类算法
- 2024-10-21 多模态图像融合新突破!9种创新SOTA方案引爆顶会
- 2024-10-21 图像语义分割入门+FCN/U-Net网络解析
- 2024-10-21 使用多尺度空间注意力的语义分割方法
- 2024-10-21 学完这篇,搞定YOLOv5网络(yolov5网络结构还可以改进吗)
- 2024-10-21 涨点神器:即插即用特征融合模块!超低参数,性能依旧SOTA
- 2024-10-21 多任务学习 | YOLOP,一个网络同时完成三大任务
- 2024-10-21 涨点超强!图像特征提取最新方法!性能效率快到飞起
- 2024-10-21 轻量级网络综述—主干网络篇(主干网络是什么意思)
- 2024-10-21 14种轻量级网络综述—主干网络篇(轻量级网络模型)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)