专业的编程技术博客社区

网站首页 > 博客文章 正文

使用Python+OpenCV进行图像处理的预处理技术

baijin 2024-08-31 16:15:23 博客文章 5 ℃ 0 评论

在本文中,我们将使用OpenCV工具进行图像处理。

涉及的主题:

  • 载入图像
  • 保存图像
  • 调整图像大小
  • 裁剪图像
  • 锐化影像

图像分类是机器学习中最有趣,最令人兴奋的主题。这是一个功能强大的工具包,计算机可以在其中识别图像中显示的图案和对象。在将机器学习应用于图像之前,我们必须转换原始图像并提取对学习算法有用的特征。

有许多可用于处理图像的库,但是开源计算机视觉(OpenCV)库对于使用其文档处理图像将非常有帮助。

载入图像

对于预处理图像,我们必须借助OpenCV“ imread”加载图像

# Load library
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
we can view the image using the “matplotlib” library
# Show image
plt.imshow(image, cmap=”gray”), plt.axis(“off”)
plt.show()

当使用“ imread”时,我们会将图像数据转换为“ Numpy”数组的数据类型。

# Show data type
type(image)
#output:
numpy.ndarray

现在,图像已将图像转换为矩阵,元素对应于各个像素。矩阵值看起来像

# Show dimensions
image
#output:
array([[140, 136, 146, …, 132, 139, 134], [144, 136, 149, …, 142, 124, 126], [152, 139, 144, …, 121, 127, 134], …, [156, 146, 144, …, 157, 154, 151], [146, 150, 147, …, 156, 158, 157], [143, 138, 147, …, 156, 157, 157]], dtype=uint8)

现在,看完结果后,我们得到了一个基本问题,例如这些矩阵值对我们意味着什么?

在灰度图像中,单个元素的值是图像中的像素强度。灰色图像的像素强度值范围从0到255,即黑色到白色。

例如,借助以下代码,我们可以看到图像中最右上角的像素的强度

# Show first pixel
image[0,0]
#output: 
140

当我们使用非灰度图像时,在矩阵中,每个元素代表三个值,分别是蓝色,绿色,红色值(BGR)。

# Load image in color
image_bgr = cv2.imread(“images/plane.jpg”, cv2.IMREAD_COLOR)
# Show pixel
image_bgr[0,0]
#output: 
array([195, 144, 111], dtype=uint8)

重要说明:默认OpenCV使用BGR模式,但是许多图像应用程序(例如Matplotlib库)使用Red,Green,Blue(RGB)模式。换句话说,这里交换红色,蓝色值。

当我们想在Matplotlib库(使用RGB)中显示OpenCV处理的图像(BGR彩色图像)时,首先将BGR转换为RGB

可以按照以下步骤进行操作:

# Convert to RGB
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)
# Show image
plt.imshow(image_rgb), plt.axis(“off”)
plt.show()

图像的分辨率为3600 x 2270,要获取矩阵的尺寸,我们可以在下面的代码中使用

# Show dimensions
image.shape
#output: 
(2270, 3600)

保存图像

我们可以使用“ imwrite”方法保存图像以进行预处理。这需要两个参数

第一个代表指定用于保存图像的文件路径,第二个代表图像本身。此处的图像格式可以由(.jpg,.png等)定义。

需要注意的重要一点是“ imwrite”将覆盖现有文件而不会出现任何错误或要求确认

# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
# Save image
cv2.imwrite(“images/plane_new.jpg”, image)
#output: 
True

调整图像大小

我们可以在预处理阶段使用“调整大小”来更改图像的大小,原因有两个。第一个是,将所有形状和大小的所有图像保持为相同的尺寸,以便可以将它们用于提取特征。这就是所谓的图像尺寸标准化,我们在缩小图像矩阵和图像信息的尺寸。

第二个是在机器学习训练过程中,需要成百上千个图像,这些图像会占用大量内存。为了减轻这种情况,我们可以调整它们的大小,以减少内存使用量。

用于机器学习算法的常见图像大小为32 * 32、64 * 64、96 * 96和256 * 256。

# Load image
import cv2
import NumPy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Resizing the image to 50x50 pixels
image_50x50 = cv2.resize(image, (50, 50))
# View image
plt.imshow(image_50x50, cmap=”gray”), plt.axis(“off”)
plt.show()

裁剪图像

我们可以通过对数组进行切片来轻松裁剪图像,然后可以将Image编码为二维numpy数组,以删除图像的外部部分并更改其尺寸。

我们知道OpenCV在元素矩阵中表示图像,在这里我们可以选择行和列,并按矩阵元素进行裁剪。

# Load image
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image in grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Select first 128 pixels of the image
image_cropped = image[:,:128]
# Show image
plt.imshow(image_cropped, cmap=”gray”), plt.axis(“off”)
plt.show()

锐化影像

首先,让我们了解图像锐化的含义是什么?

这是一种用于增加图像的表观清晰度的技术当我们从原始图像中减去模糊图像时,它用于检测图像中的边缘。

当我们要锐化图像时,首先创建一个突出显示目标像素的内核,然后使用“ filter2D”将其应用于图像

# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Create kernel
kernel = np.array([[0, -1, 0],
 [-1, 5,-1],
 [0, -1, 0]])
# Sharpen image
image_sharp = cv2.filter2D(image, -1, kernel)
# Show image
plt.imshow(image_sharp, cmap=”gray”), plt.axis(“off”)
plt.show()

结论:

图像处理在视力问题中非常有用。在大型算法中,始终需要基本的预处理技术知识。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表