人工智能和机器学习系列(五) OpenCV库

2021-08-24 11:23:03 浏览数 (5825)

简介

OpenCV 是一个用于(实时)图像处理的库,该模块简要介绍了 OpenCV 并演示了其对象检测功能。这是我们学习 Python 及其在机器学习和 AI 中的应用系列中的第五个模块。在上一个模块中,我们认识了许多ML和AI中相关的Python库,下面就一起来深入研究一下这些库的使用,我们先开始学习OpenCV的使用。

安装

OpenCV 可以通过 pip 安装,方法是在 Jupyter Notebook 单元中运行以下命令:

!pip install --upgrade opencv-python

pip 是 Python 的默认包管理器和独立的可执行文件,但以这种方式运行它可确保将包安装到 Anaconda 环境中。

如果软件包安装正确,此 Python 代码应该可以正常运行:

import cv2

因为我们要在我们的 Jupyter Notebook 中显示图像,我们还应该确保matplotlib已安装:

!pip install --upgrade matplotlib

读取和绘制图像

读取 OpenCV 可以处理的图像很简单:

import cv2
im = cv2.imread("path/to/image.jpg")

OpenCV 支持多种图像格式,当解析图像失败时,结果imread将是None. 请注意,如果未找到图像文件,则不会引发错误 - 结果也会如此None

假设找到了图像,然后我们可以使用matplotlib. 为此,我们将使用此辅助函数:

from matplotlib import pyplot
def plot_img(img):
    rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    pyplot.imshow(rgb)

OpenCV 读取 BGR 颜色格式的图像,但​matplotlib​希望它们是 RGB,所以首先我们必须转换图像。然后就可以绘制了。

您可以按如下方式使用此功能:

plot_img(im)

OpenCV 和​matplotlib​集成如此干净是因为 OpenCV 图像实际上只是一个包含像素值的多维 NumPy 数组,并且​matplotlib​可以使用它。

图 1

物体检测

很多是OpenCV的可以做。我们将特别关注对象检测。

对象检测与所谓的级联分类器一起工作。这种方法使用机器学习:分类器在包含所需对象的图像(正图像)和不包含它的图像(负图像)上进行训练。您可以训练自己的分类器,但 OpenCV 还提供了几个可从其 GitHub 下载的预训练模型。

让我们试试俄罗斯车牌的预训练分类器haarcascade_russian_plate_number.xml。如果您想要测试图像,可以使用Sergey Rodovnichenko 的 Lada Vesta 图像

我们可以读取图像并绘制它以查看是否一切顺利,就像以前一样:

car = cv2.imread("Pictures/lada-vesta.jpg")
plot_img(car)

图 2

接下来,我们创建分类器:

蟒蛇复制代码

classifier = cv2.CascadeClassifier()
classifier.load("path/to/haarcascade_russian_plate_number.xml")

图 3

检测工作是通过以下​detectMultiScale​方法完成的:

plates = classifier.detectMultiScale(car)

这将返回一个 NumPy 数组。它实际上是一个数组数组,每个内部数组都是检测到的板的矩形边界,格式为​[ x, y, width, height ]​. 为了直观地显示它们,我们可以在图像上绘制矩形,然后绘制结果:

with_indicators = car
for plate in plates:
    x, y, width, height = plate
    with_indicators = cv2.rectangle(with_indicators, (x, y), 
                                    (x + width, y + height), 
                                    (0, 0, 255), 5)

矩形函数采用图像、左上角坐标、右下角坐标、颜色和厚度。它返回一个带有矩形的新图像。我们可以绘制结果:

plot_img(with_indicators)

图 4

这个例子展示了 OpenCV 的针对俄罗斯车牌的预训练分类器,但这并不是唯一可用的分类器。还有用于面部、眼睛等的预训练分类器,它们的使用方式与该分类器完全相同。

结论

我们只是触及了 OpenCV 功能的皮毛。OpenCV 具有更多处理功能(转换、过滤器、2D 特征检测等),并且可以实时处理视频帧。互联网上有很多关于 OpenCV 的资料。该官方教程是一个良好的开端,但你也可以找到很多的帮助,如果你想与OpenCV的解决问题专门进行搜索。