在本文中,我们将使用OpenCV工具进行图像处理。
涉及的主题:
- 载入图像
- 保存图像
- 调整图像大小
- 裁剪图像
- 锐化影像
图像分类是机器学习中最有趣,最令人兴奋的主题。这是一个功能强大的工具包,计算机可以在其中识别图像中显示的图案和对象。在将机器学习应用于图像之前,我们必须转换原始图像并提取对学习算法有用的特征。
有许多可用于处理图像的库,但是开源计算机视觉(OpenCV)库对于使用其文档处理图像将非常有帮助。
载入图像
对于预处理图像,我们必须借助OpenCV“ imread”加载图像
# Load library
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
we can view the image using the “matplotlib” library
# Show image
plt.imshow(image, cmap=”gray”), plt.axis(“off”)
plt.show()
当使用“ imread”时,我们会将图像数据转换为“ Numpy”数组的数据类型。
# Show data type
type(image)
#output:
numpy.ndarray
现在,图像已将图像转换为矩阵,元素对应于各个像素。矩阵值看起来像
# Show dimensions
image
#output:
array([[140, 136, 146, …, 132, 139, 134], [144, 136, 149, …, 142, 124, 126], [152, 139, 144, …, 121, 127, 134], …, [156, 146, 144, …, 157, 154, 151], [146, 150, 147, …, 156, 158, 157], [143, 138, 147, …, 156, 157, 157]], dtype=uint8)
现在,看完结果后,我们得到了一个基本问题,例如这些矩阵值对我们意味着什么?
在灰度图像中,单个元素的值是图像中的像素强度。灰色图像的像素强度值范围从0到255,即黑色到白色。
例如,借助以下代码,我们可以看到图像中最右上角的像素的强度
# Show first pixel
image[0,0]
#output:
140
当我们使用非灰度图像时,在矩阵中,每个元素代表三个值,分别是蓝色,绿色,红色值(BGR)。
# Load image in color
image_bgr = cv2.imread(“images/plane.jpg”, cv2.IMREAD_COLOR)
# Show pixel
image_bgr[0,0]
#output:
array([195, 144, 111], dtype=uint8)
重要说明:默认OpenCV使用BGR模式,但是许多图像应用程序(例如Matplotlib库)使用Red,Green,Blue(RGB)模式。换句话说,这里交换红色,蓝色值。
当我们想在Matplotlib库(使用RGB)中显示OpenCV处理的图像(BGR彩色图像)时,首先将BGR转换为RGB
可以按照以下步骤进行操作:
# Convert to RGB
image_rgb = cv2.cvtColor(image_bgr, cv2.COLOR_BGR2RGB)
# Show image
plt.imshow(image_rgb), plt.axis(“off”)
plt.show()
图像的分辨率为3600 x 2270,要获取矩阵的尺寸,我们可以在下面的代码中使用
# Show dimensions
image.shape
#output:
(2270, 3600)
保存图像
我们可以使用“ imwrite”方法保存图像以进行预处理。这需要两个参数
第一个代表指定用于保存图像的文件路径,第二个代表图像本身。此处的图像格式可以由(.jpg,.png等)定义。
需要注意的重要一点是“ imwrite”将覆盖现有文件而不会出现任何错误或要求确认
# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane.jpg”, cv2.IMREAD_GRAYSCALE)
# Save image
cv2.imwrite(“images/plane_new.jpg”, image)
#output:
True
调整图像大小
我们可以在预处理阶段使用“调整大小”来更改图像的大小,原因有两个。第一个是,将所有形状和大小的所有图像保持为相同的尺寸,以便可以将它们用于提取特征。这就是所谓的图像尺寸标准化,我们在缩小图像矩阵和图像信息的尺寸。
第二个是在机器学习训练过程中,需要成百上千个图像,这些图像会占用大量内存。为了减轻这种情况,我们可以调整它们的大小,以减少内存使用量。
用于机器学习算法的常见图像大小为32 * 32、64 * 64、96 * 96和256 * 256。
# Load image
import cv2
import NumPy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Resizing the image to 50x50 pixels
image_50x50 = cv2.resize(image, (50, 50))
# View image
plt.imshow(image_50x50, cmap=”gray”), plt.axis(“off”)
plt.show()
裁剪图像
我们可以通过对数组进行切片来轻松裁剪图像,然后可以将Image编码为二维numpy数组,以删除图像的外部部分并更改其尺寸。
我们知道OpenCV在元素矩阵中表示图像,在这里我们可以选择行和列,并按矩阵元素进行裁剪。
# Load image
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image in grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Select first 128 pixels of the image
image_cropped = image[:,:128]
# Show image
plt.imshow(image_cropped, cmap=”gray”), plt.axis(“off”)
plt.show()
锐化影像
首先,让我们了解图像锐化的含义是什么?
这是一种用于增加图像的表观清晰度的技术。当我们从原始图像中减去模糊图像时,它用于检测图像中的边缘。
当我们要锐化图像时,首先创建一个突出显示目标像素的内核,然后使用“ filter2D”将其应用于图像
# Load libraries
import cv2
import numpy as np
from matplotlib import pyplot as plt
# Load image as grayscale
image = cv2.imread(“images/plane_256x256.jpg”, cv2.IMREAD_GRAYSCALE)
# Create kernel
kernel = np.array([[0, -1, 0],
[-1, 5,-1],
[0, -1, 0]])
# Sharpen image
image_sharp = cv2.filter2D(image, -1, kernel)
# Show image
plt.imshow(image_sharp, cmap=”gray”), plt.axis(“off”)
plt.show()
结论:
图像处理在视力问题中非常有用。在大型算法中,始终需要基本的预处理技术知识。
本文暂时没有评论,来添加一个吧(●'◡'●)