专业的编程技术博客社区

网站首页 > 博客文章 正文

YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器

baijin 2024-10-21 03:31:12 博客文章 16 ℃ 0 评论

YOLO-OB: An improved anchor-free real-time multiscale colon polyp detector in colonoscopy

Githubhttps://github.com/seanyan62/YOLO-OB

标题:YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器

摘要:结肠癌预计将在2023年成为美国第二大癌症死因。尽管结肠镜检查是早期预防结肠癌最有效的方法之一,但最多有30%的息肉可能被内窥镜医生忽略,从而增加患者患结肠癌的风险。虽然深度神经网络已被证明是提高息肉检测率的有效手段。然而,息肉大小的变化带来以下问题:(1)很难设计一个高效且充分的多尺度特征融合结构;(2)使用固定大小的锚定框匹配不同大小的息肉是一个困难的挑战。这些问题降低了息肉检测的性能,同时降低了模型的训练和检测效率。为了解决这些挑战,本文提出了一个名为YOLO-OB的新模型。具体而言,我们开发了一个双向多尺度特征融合结构BiSPFPN,可以增强卷积神经网络在不同深度之间的特征融合能力。我们采用了ObjectBox检测头,该头部使用基于中心的无锚定盒回归策略,可以在任何尺度的特征图上检测到不同大小的息肉。在公共数据集SUN和自采集的结肠息肉数据集Union上的实验证明,所提出的模型显著提高了息肉检测的各种性能指标,尤其是召回率。与公共数据集SUN上的最先进结果相比,所提出的方法使召回率从91.5%增加到98.23%,提高了6.73%。此外,我们的YOLO-OB能够使用RTX3090显卡以每秒39帧的速度实现实时息肉检测。

解决的问题

该论文要解决的问题是在结肠镜检查中,提高多尺度结肠息肉检测的准确性和实时性,同时避免使用锚点。通过应用YOLO-OB(一种改进的锚点自由实时多尺度结肠息肉检测器),该论文旨在解决现有技术中息肉检测的挑战,包括检测率不高、实时性不足以及需要手动设置锚点等问题。通过提高检测准确性和实时性,以及消除对锚点的依赖,该论文旨在推动结肠息肉检测技术的进步,从而有助于更早地发现并治疗结肠癌。

创新点

  1. 提出了一种新的多尺度特征融合结构,即BiSPFPN,以增强CNN不同深度的特征融合能力。通过双向特征融合,该结构能够更好地捕捉到不同尺度的特征信息,从而提高模型对不同大小息肉的检测能力。
  2. 提出了YOLO-OB模型,通过改进YOLO系列算法,解决了多尺度检测问题。该模型能够在不同的输入尺度下,提高模型的检测精度和鲁棒性。
  3. 针对多尺度检测问题,引入了数据增强技术,通过对图像进行随机缩放和翻转,增加了模型的泛化能力。
  4. 设计了一种新的检测头模块,通过引入注意力机制和多尺度特征融合,提高了模型对息肉的识别精度和鲁棒性。

系统架构

结果

结论

基于YOLO系列算法的基本框架,本文提出了一种称为YOLO-OB的息肉检测模型。与当前最先进的模型相比,我们的模型能够有效提高息肉检测的召回率。我们专注于多尺度检测问题,并在几个方面进行了改进:数据增强、多尺度特征融合和检测头模块。为验证模型的泛化性能,我们手动标注了从不同医院收集的结肠息肉数据集Union,以进一步扩展训练和测试样本。

在数据预处理方面,我们使用马赛克数据增强手动构建了更多多样尺寸的训练样本。对于特征融合,我们采用了多分辨率检测方法,并使用DarkNet53中不同深度的特征图实现多尺度息肉检测。我们还设计了一个BiSPFPN层,以有效融合骨干网络不同深度的特征图。为了提高检测头的性能,我们设计了一种基于ObjectBox的无锚定盒回归方法。

我们提出的模型在公共数据集SUN和私有数据集Union上均取得了高性能。YOLO-OB在RTX3090上能够以每秒39帧的速度实现实时息肉检测,在GTX1080Ti显卡上为每秒29帧。因此,它可以应用于实时结肠镜CAD系统,帮助医生检测结肠息肉。这项工作的实施可以减少漏诊息肉的发生,从而降低患者患结肠癌的风险。

实际应用价值

  1. 改进了检测算法:该论文提出了一种新的盒回归策略,可以更准确地检测目标物体。这种策略在每个特征图上只使用包含目标中心(蓝色单元格)的单元格来回归边界框,而将其他特征单元格标记为负样本。这种方法可以显著提高目标检测的准确性,特别是在处理不同尺度的目标时。
  2. 提高了模型的泛化能力:通过在每个特征图上获取三个正样本点,该策略能够让每个特征图都具有预测不同尺度对象的能力。这使得模型能够更好地适应各种应用场景,提高了模型的泛化能力。
  3. 促进了医学影像分析:该论文的方法可以应用于医学影像分析中,特别是在内窥镜视频流中检测息肉等病变。通过使用该论文的方法,可以更准确地检测病变,提高医学影像分析的准确性和效率。
  4. 推动了深度学习在计算机视觉领域的发展:该论文的方法是一种深度学习算法,可以应用于计算机视觉领域的各种任务中。该方法的应用不仅提高了目标检测的准确性,也为其他计算机视觉任务提供了新的思路和方法。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表