在本文中，我们将使用OpenCV工具进行图像处理。

涉及的主题：

载入图像
保存图像
调整图像大小
裁剪图像
锐化影像

图像分类是机器学习中最有趣，最令人兴奋的主题。这是一个功能强大的工具包，计算机可以在其中识别图像中显示的图案和对象。在将机器学习应用于图像之前，我们必须转换原始图像并提取对学习算法有用的特征。

有许多可用于处理图像的库，但是开源计算机视觉（OpenCV）库对于使用其文档处理图像将非常有帮助。

载入图像

对于预处理图像，我们必须借助OpenCV“ imread”加载图像

# Load library
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
we can view the image using the “matplotlib” library
# Show image
plt.imshow(image, cmap=”gray”), plt.axis(“off”)
plt.show()

当使用“ imread”时，我们会将图像数据转换为“ Numpy”数组的数据类型。

# Show data type
type(image)
#output:
numpy.ndarray

现在，图像已将图像转换为矩阵，元素对应于各个像素。矩阵值看起来像

# Show dimensions
image
#output:
array([[140, 136, 146, …, 132, 139, 134], [144, 136, 149, …, 142, 124, 126], [152, 139, 144, …, 121, 127, 134], …, [156, 146, 144, …, 157, 154, 151], [146, 150, 147, …, 156, 158, 157], [143, 138, 147, …, 156, 157, 157]], dtype=uint8)

现在，看完结果后，我们得到了一个基本问题，例如这些矩阵值对我们意味着什么？

在灰度图像中，单个元素的值是图像中的像素强度。灰色图像的像素强度值范围从0到255，即黑色到白色。

例如，借助以下代码，我们可以看到图像中最右上角的像素的强度

# Show first pixel
image[0,0]
#output: 
140

当我们使用非灰度图像时，在矩阵中，每个元素代表三个值，分别是蓝色，绿色，红色值（BGR）。

# Load image in color
image_bgr = cv2.imread(“images/plane.jpg”, cv2.IMREAD_COLOR)
# Show pixel
image_bgr[0,0]
#output: 
array([195, 144, 111], dtype=uint8)

重要说明：默认OpenCV使用BGR模式，但是许多图像应用程序（例如Matplotlib库）使用Red，Green，Blue（RGB）模式。换句话说，这里交换红色，蓝色值。

当我们想在Matplotlib库（使用RGB）中显示OpenCV处理的图像（BGR彩色图像）时，首先将BGR转换为RGB

可以按照以下步骤进行操作：

# Convert to RGB
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)
# Show image
plt.imshow(image_rgb), plt.axis(“off”)
plt.show()

图像的分辨率为3600 x 2270，要获取矩阵的尺寸，我们可以在下面的代码中使用

# Show dimensions
image.shape
#output: 
(2270, 3600)

保存图像

我们可以使用“ imwrite”方法保存图像以进行预处理。这需要两个参数

第一个代表指定用于保存图像的文件路径，第二个代表图像本身。此处的图像格式可以由（.jpg，.png等）定义。

需要注意的重要一点是“ imwrite”将覆盖现有文件而不会出现任何错误或要求确认

# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
# Save image
cv2.imwrite(“images/plane_new.jpg”, image)
#output: 
True

调整图像大小

我们可以在预处理阶段使用“调整大小”来更改图像的大小，原因有两个。第一个是，将所有形状和大小的所有图像保持为相同的尺寸，以便可以将它们用于提取特征。这就是所谓的图像尺寸标准化，我们在缩小图像矩阵和图像信息的尺寸。

第二个是在机器学习训练过程中，需要成百上千个图像，这些图像会占用大量内存。为了减轻这种情况，我们可以调整它们的大小，以减少内存使用量。

用于机器学习算法的常见图像大小为32 * 32、64 * 64、96 * 96和256 * 256。

# Load image
import cv2
import NumPy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Resizing the image to 50x50 pixels
image_50x50 = cv2.resize(image, (50, 50))
# View image
plt.imshow(image_50x50, cmap=”gray”), plt.axis(“off”)
plt.show()

裁剪图像

我们可以通过对数组进行切片来轻松裁剪图像，然后可以将Image编码为二维numpy数组，以删除图像的外部部分并更改其尺寸。

我们知道OpenCV在元素矩阵中表示图像，在这里我们可以选择行和列，并按矩阵元素进行裁剪。

# Load image
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image in grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Select first 128 pixels of the image
image_cropped = image[:,:128]
# Show image
plt.imshow(image_cropped, cmap=”gray”), plt.axis(“off”)
plt.show()

锐化影像

首先，让我们了解图像锐化的含义是什么？

这是一种用于增加图像的表观清晰度的技术。当我们从原始图像中减去模糊图像时，它用于检测图像中的边缘。

当我们要锐化图像时，首先创建一个突出显示目标像素的内核，然后使用“ filter2D”将其应用于图像

# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Create kernel
kernel = np.array([[0, -1, 0],
 [-1, 5,-1],
 [0, -1, 0]])
# Sharpen image
image_sharp = cv2.filter2D(image, -1, kernel)
# Show image
plt.imshow(image_sharp, cmap=”gray”), plt.axis(“off”)
plt.show()

结论：

图像处理在视力问题中非常有用。在大型算法中，始终需要基本的预处理技术知识。

网站首页 > 博客文章正文

使用Python+OpenCV进行图像处理的预处理技术

涉及的主题：

载入图像

保存图像

调整图像大小

裁剪图像

锐化影像

结论：

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 博客文章 正文

使用Python+OpenCV进行图像处理的预处理技术

涉及的主题：

载入图像

保存图像

调整图像大小

裁剪图像

锐化影像

结论：

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 博客文章正文

取消回复欢迎你发表评论: