网站首页 > 博客文章正文

YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器

baijin 2024-10-21 03:31:12 博客文章 16 ℃ 0 评论

YOLO-OB: An improved anchor-free real-time multiscale colon polyp detector in colonoscopy

Github：https://github.com/seanyan62/YOLO-OB

标题：YOLO-OB：一种改进的无锚实时多尺度结肠镜结肠息肉检测器

摘要：结肠癌预计将在2023年成为美国第二大癌症死因。尽管结肠镜检查是早期预防结肠癌最有效的方法之一，但最多有30%的息肉可能被内窥镜医生忽略，从而增加患者患结肠癌的风险。虽然深度神经网络已被证明是提高息肉检测率的有效手段。然而，息肉大小的变化带来以下问题：（1）很难设计一个高效且充分的多尺度特征融合结构；（2）使用固定大小的锚定框匹配不同大小的息肉是一个困难的挑战。这些问题降低了息肉检测的性能，同时降低了模型的训练和检测效率。为了解决这些挑战，本文提出了一个名为YOLO-OB的新模型。具体而言，我们开发了一个双向多尺度特征融合结构BiSPFPN，可以增强卷积神经网络在不同深度之间的特征融合能力。我们采用了ObjectBox检测头，该头部使用基于中心的无锚定盒回归策略，可以在任何尺度的特征图上检测到不同大小的息肉。在公共数据集SUN和自采集的结肠息肉数据集Union上的实验证明，所提出的模型显著提高了息肉检测的各种性能指标，尤其是召回率。与公共数据集SUN上的最先进结果相比，所提出的方法使召回率从91.5%增加到98.23%，提高了6.73%。此外，我们的YOLO-OB能够使用RTX3090显卡以每秒39帧的速度实现实时息肉检测。

解决的问题：

该论文要解决的问题是在结肠镜检查中，提高多尺度结肠息肉检测的准确性和实时性，同时避免使用锚点。通过应用YOLO-OB（一种改进的锚点自由实时多尺度结肠息肉检测器），该论文旨在解决现有技术中息肉检测的挑战，包括检测率不高、实时性不足以及需要手动设置锚点等问题。通过提高检测准确性和实时性，以及消除对锚点的依赖，该论文旨在推动结肠息肉检测技术的进步，从而有助于更早地发现并治疗结肠癌。

创新点：

提出了一种新的多尺度特征融合结构，即BiSPFPN，以增强CNN不同深度的特征融合能力。通过双向特征融合，该结构能够更好地捕捉到不同尺度的特征信息，从而提高模型对不同大小息肉的检测能力。
提出了YOLO-OB模型，通过改进YOLO系列算法，解决了多尺度检测问题。该模型能够在不同的输入尺度下，提高模型的检测精度和鲁棒性。
针对多尺度检测问题，引入了数据增强技术，通过对图像进行随机缩放和翻转，增加了模型的泛化能力。
设计了一种新的检测头模块，通过引入注意力机制和多尺度特征融合，提高了模型对息肉的识别精度和鲁棒性。

系统架构：

结果：

结论：

基于YOLO系列算法的基本框架，本文提出了一种称为YOLO-OB的息肉检测模型。与当前最先进的模型相比，我们的模型能够有效提高息肉检测的召回率。我们专注于多尺度检测问题，并在几个方面进行了改进：数据增强、多尺度特征融合和检测头模块。为验证模型的泛化性能，我们手动标注了从不同医院收集的结肠息肉数据集Union，以进一步扩展训练和测试样本。

在数据预处理方面，我们使用马赛克数据增强手动构建了更多多样尺寸的训练样本。对于特征融合，我们采用了多分辨率检测方法，并使用DarkNet53中不同深度的特征图实现多尺度息肉检测。我们还设计了一个BiSPFPN层，以有效融合骨干网络不同深度的特征图。为了提高检测头的性能，我们设计了一种基于ObjectBox的无锚定盒回归方法。

我们提出的模型在公共数据集SUN和私有数据集Union上均取得了高性能。YOLO-OB在RTX3090上能够以每秒39帧的速度实现实时息肉检测，在GTX1080Ti显卡上为每秒29帧。因此，它可以应用于实时结肠镜CAD系统，帮助医生检测结肠息肉。这项工作的实施可以减少漏诊息肉的发生，从而降低患者患结肠癌的风险。

实际应用价值：

改进了检测算法：该论文提出了一种新的盒回归策略，可以更准确地检测目标物体。这种策略在每个特征图上只使用包含目标中心（蓝色单元格）的单元格来回归边界框，而将其他特征单元格标记为负样本。这种方法可以显著提高目标检测的准确性，特别是在处理不同尺度的目标时。
提高了模型的泛化能力：通过在每个特征图上获取三个正样本点，该策略能够让每个特征图都具有预测不同尺度对象的能力。这使得模型能够更好地适应各种应用场景，提高了模型的泛化能力。
促进了医学影像分析：该论文的方法可以应用于医学影像分析中，特别是在内窥镜视频流中检测息肉等病变。通过使用该论文的方法，可以更准确地检测病变，提高医学影像分析的准确性和效率。
推动了深度学习在计算机视觉领域的发展：该论文的方法是一种深度学习算法，可以应用于计算机视觉领域的各种任务中。该方法的应用不仅提高了目标检测的准确性，也为其他计算机视觉任务提供了新的思路和方法。

上一篇：轻量级网络综述—主干网络篇（主干网络是什么意思）
下一篇：涨点超强!图像特征提取最新方法!性能效率快到飞起

网站首页 > 博客文章正文

YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 博客文章 正文

YOLO-OB:一种改进的无锚实时多尺度结肠镜结肠息肉检测器

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 博客文章正文

取消回复欢迎你发表评论: