百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

18分钟学会Python人脸检测(python人脸检测代码)

off999 2024-10-20 08:09 18 浏览 0 评论

本教程将向您介绍使用 OpenCV 库在 Python 中进行对象检测的概念以及如何利用它执行面部检测等任务。

什么是计算机视觉?

我们正处于人工智能革命的时代,深度学习领域取得了令人瞩目的进步。在过去的几个月里,我们见证了人工智能的应用,这些应用通过生成逼真的艺术作品、通过律师资格考试以及编写 Python 代码来创建网站,震惊了世界。

计算机视觉是一种深度学习应用,是这场革命的核心。它允许计算机从图像和视频文件等视觉输入中获得洞察力。计算机视觉的示例包括人脸检测、面部识别、人体姿势估计和障碍物检测。在本教程中,我们将探索如何使用 OpenCV 执行人脸检测,查看静态图像和实时图像。

计算机视觉的应用

既然人类视觉对于大多数人来说是一项相对简单的任务,为什么我们还需要计算机视觉呢?

虽然人类确实可以轻松执行视觉任务,并且只需要少量数据样本,但人工智能具有高度可扩展性。计算机视觉模型在部署到监控和自动驾驶汽车中时可以处理数百万个数据点。这是人类视觉根本无法达到的规模。

此外,计算机视觉应用可以集成到传感器、摄像头和智能设备中,实现全天候实时图像处理。这对于人类来说同样是一项极具挑战性的壮举。

最后,人工智能不易受偏见、疲劳和注意力不集中的影响。虽然人类可能会感到疲劳并忽视安全漏洞,但计算机视觉应用程序永远不会出现故障,从而降低了错过事件的风险。

让我们看看计算机视觉在我们日常生活中的一些实际应用:

监视

计算机视觉应用(例如物体识别和姿势估计)通常部署在安全设备中,以实现人员监控自动化。例如,姿势估计模型可以跟踪一个人的肢体语言,以判断他们是否在煽动暴力、遇到医疗紧急情况或即将偷窃某物。然后,这些系统可以触发通知,提醒相关部门提供帮助,从而缩短响应时间并提高公共安全。

零售

计算机视觉模型可以部署在零售店,以跟踪顾客的眼睛位置、肢体语言和商店内的移动。

这些算法可以为零售商提供以下有关用户行为的洞察:

  • 是否有任何特定的促销活动或产品可以吸引人们的注意力并吸引他们进入商店?
  • 顾客在商店里通常走哪条路径?
  • 哪种类型的产品植入最能引起人们的关注?
  • 顾客多久会接触一次横幅和标牌等促销材料?

零售商可以利用这些见解来改进商店的营销策略,并定制产品展示以推动销售。

自动驾驶汽车

自动驾驶领域从计算机视觉技术中受益匪浅。

物体检测模型部署在车辆上,以识别道路上的行人、其他车辆和动物。

计算机视觉应用程序可以解释停车标志和交通信号灯,准确估计车辆与其他物体之间的距离,并避开坑洼等障碍物,以确保安全的驾驶体验。

OpenCV 简介

现在我们了解了计算机视觉应用程序有多么有用,让我们研究一下用于实现它们的流行工具。OpenCV是一个计算机视觉库,支持 Python、C++ 和 Java 等编程语言。

该软件包最初由英特尔于 1999 年创建,后来开源并向公众发布。

OpenCV 允许开发人员和非数学家轻松构建计算机视觉应用程序,而无需从头开始编写代码。该库拥有超过 2,500 种算法,允许用户执行面部识别和物体检测等任务。

谷歌、微软、IBM 和英特尔等知名组织的开发人员和数据从业者广泛使用 OpenCV 库,该库目前可免费用于商业用途。

在本文中,我们将使用 OpenCV 在 Python 中执行人脸检测。

在本教程结束时,您将了解如何:

  • 使用 Python 中的 OpenCV 检测图像中的人脸
  • 在网络摄像头的实时流中执行实时人脸检测
  • 识别并标记图像中的名人面孔

什么是人脸检测?

人脸检测涉及识别图像或视频中的人脸。这是通过分析视觉输入来确定是否存在人的面部特征来完成的。

由于人类面孔种类繁多,人脸检测模型通常需要对大量输入数据进行训练才能准确无误。训练数据集必须包含来自不同背景、性别和文化的人的足够代表性。

这些算法还需要输入许多包含不同光照、角度和方向的训练样本,才能在现实场景中做出正确的预测。

这些细微差别使得人脸检测成为一项重要且耗时的任务,需要数小时的模型训练和数百万个数据样本。

值得庆幸的是,OpenCV 软件包附带了用于人脸检测的预训练模型,这意味着我们不必从头开始训练算法。更具体地说,该库采用一种称为 Haar 级联的机器学习方法来识别视觉数据中的对象。

OpenCV 人脸检测教程

在本节中,我们将学习使用 OpenCV 和 Python 应用一种名为 Haar Cascade 的流行人脸检测方法进行人脸检测。


Haar 级联分类器简介

该方法最早在Paul Viola 和 Michael Jones 撰写的论文《使用增强级联简单特征进行快速对象检测》中提出。

该技术背后的理念是使用级联分类器来检测图像中的不同特征。然后将这些分类器组合成一个强分类器,可以准确区分包含人脸的样本和不包含人脸的样本。

OpenCV 内置的 Haar Cascade 分类器已在大量人脸数据集上进行过训练,因此无需进一步训练。我们只需从库中加载分类器并使用它对输入图像执行人脸检测即可。

安装 Python 版 OpenCV

要安装 OpenCV 库,只需打开命令提示符或终端窗口并运行以下命令:

pip install opencv-python

仅当您的设备上已安装 pip 时,此命令才有效。


OpenCV 用于图像中人脸检测

我们将构建一个检测器来识别 Unsplash照片中的人脸。input_image在开始编码之前,请确保将图片保存到您的工作目录并将其重命名为。

步骤 1:导入 OpenCV 包

现在,让我们导入OpenCV并使用以下代码行输入输入图像路径:

import cv2


imagePath = 'input_image.jpg'


第 2 步:读取图像

然后,我们需要用OpenCV的imread()函数读取图像:

img = cv2.imread(imagePath)



步骤 3:将图像转换为灰度

为了提高计算效率,我们首先需要将此图像转换为灰度,然后再对其进行人脸检测:

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)


步骤 4:加载分类器

让我们加载OpenCV内置的预训练的Haar Cascade分类器:

face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


请注意,我们正在使用一个名为的文件haarcascade_frontalface_default.xml。此分类器专门用于检测视觉输入中的正面。


OpenCV 还提供了其他预训练模型来检测图像中的不同物体 - 例如人的眼睛、微笑、上半身,甚至是车辆的牌照。您可以通过检查库的GitHub 存储库来了解有关 OpenCV 内置的不同分类器的更多信息。

步骤 5:执行人脸检测

我们现在可以使用刚刚加载的分类器对灰度图像执行人脸检测:

face = face_classifier.detectMultiScale(
    gray_image, scaleFactor=1.1, minNeighbors=5, minSize=(40, 40)
)


让我们分解一下上述代码中指定的方法和参数:

  1. detectMultiScale():

detectMultiScale() 方法用于识别输入图像中不同大小的人脸。

  1. grey_image


这个方法中第一个参数叫做grey_image,就是我们之前创建的灰度图像。

  1. scaleFactor

此参数用于缩小输入图像的尺寸,以便算法更容易检测较大的人脸。在本例中,我们指定了比例因子 1.1,表示我们希望将图像尺寸缩小 10%。

  1. minNeighbors

级联分类器在图像中应用滑动窗口来检测其中的人脸。您可以将这些窗口视为矩形。

最初,分类器会捕获大量误报。这些误报可通过参数消除minNeighbors,该参数指定了需要识别的相邻矩形的数量,才能将对象视为有效检测。

总而言之,将 0 或 1 这样的小值传递给此参数会导致大量的误报,而大量的误报可能会导致失去许多真正报。

这里的诀窍是找到一种权衡,让我们能够消除假阳性,同时还能准确识别真阳性。

  1. minSize

最后,该minSize参数设置要检测的物体的最小尺寸。模型将忽略小于指定最小尺寸的人脸。

步骤6:绘制边界框

现在模型已经检测到图像中的人脸,让我们运行以下代码行来围绕这些人脸创建一个边界框:

for (x, y, w, h) in face:
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 4)


face变量是一个包含四个值的数组:检测到人脸的 x 轴和 y 轴,以及它们的宽度和高度。上述代码对已识别的人脸进行迭代,并创建一个跨越这些测量值的边界框。


该参数0,255,0表示边界框的颜色,为绿色,并4表示其厚度。

步骤7:显示图像

为了显示检测到的人脸图像,我们首先需要将图像从 BGR 格式转换为 RGB:

img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


现在,让我们使用 Matplotlib 库来显示图像:

import matplotlib.pyplot as plt


plt.figure(figsize=(20,10))
plt.imshow(img_rgb)
plt.axis('off')


上述代码应生成以下输出:

伟大的!

该模型已成功检测出该图像中的人脸并在其周围创建了一个边界框。

使用 OpenCV 进行实时人脸检测

现在我们已经成功地使用 OpenCV 在静态图像上执行了人脸检测,让我们看看如何在实时视频流上执行相同的操作。

步骤 1:先决条件

首先,让我们继续导入 OpenCV 库并加载 Haar Cascade 模型,就像我们在上一节中所做的那样。如果您之前已经运行过此代码块,则可以跳过它:

import cv2


face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


第 2 步:访问网络摄像头

现在,我们需要访问设备的摄像头来读取实时视频数据流。可以使用以下代码完成此操作:

video_capture = cv2.VideoCapture(0)


请注意,我们已将参数传递0给 VideoCapture() 函数。这告诉 OpenCV 使用我们设备上的默认摄像头。如果您的设备连接了多个摄像头,则可以相应地更改此参数值。


步骤 3:识别视频流中的人脸

现在,让我们创建一个函数来检测视频流中的人脸并在它们周围绘制一个边界框:

def detect_bounding_box(vid):
    gray_image = cv2.cvtColor(vid, cv2.COLOR_BGR2GRAY)
    faces = face_classifier.detectMultiScale(gray_image, 1.1, 5, minSize=(40, 40))
    for (x, y, w, h) in faces:
        cv2.rectangle(vid, (x, y), (x + w, y + h), (0, 255, 0), 4)
    return faces


detect_bounding_box函数以视频帧作为输入。


在这个函数中,我们使用与之前相同的代码,在执行人脸检测之前将帧转换为灰度。

然后,我们还使用与之前相同的scaleFactorminNeighbors和的参数值来检测该图像中的人脸。minSize

4最后,我们在框架周围绘制一个厚度合适的绿色边界框。

步骤 4:创建实时人脸检测循环

现在,我们需要创建一个无限的 while 循环,它将从我们的网络摄像头捕获视频帧并将人脸检测功能应用于它:

while True:


    result, video_frame = video_capture.read()  # read frames from the video
    if result is False:
        break  # terminate the loop if the frame is not read successfully


    faces = detect_bounding_box(
        video_frame
    )  # apply the function we created to the video frame


    cv2.imshow(
        "My Face Detection Project", video_frame
    )  # display the processed frame in a window named "My Face Detection Project"


    if cv2.waitKey(1) & 0xFF == ord("q"):
        break


video_capture.release()
cv2.destroyAllWindows()


运行上述代码后,您应该会看到My Face Detection Project屏幕上出现一个名为的窗口:

无论您在框架内移动到哪里,算法都会跟踪您的脸部并在其周围创建一个绿色边界框。

在上面的框架中,模型识别了我的脸和我手中的驾照上的照片。

您还可以通过举起多张照片或让不同的人站在相机后面的不同角度来测试此模型的有效性。该模型应该能够在不同的背景或照明设置下识别所有人的脸。

如果您想退出程序,可以按键盘上的“q”键退出循环。

使用 OpenCV 进行人脸检测 - 下一步

现在您已经学会了如何使用 OpenCV 库成功检测图像和实时视频中的人脸,下面是您可以采取的一些步骤,将您的知识提升到一个新的水平:

创建自己的项目

您可以使用本教程中提供的代码作为您自己的人脸检测项目的起点。

扩展该项目的一种方法是识别不同类型的输入数据(例如 PDF 文件或监控图像)中的人脸。您甚至可以设置自己的安全摄像头,并实时对其捕获的数据进行人脸检测。

此外,您还可以在大型数据集上创建人脸检测模型,或者更进一步执行诸如在图像数据集中检测一个人是否戴着口罩之类的任务。

Kaggle 上的图像中的人脸检测和人脸口罩检测数据集是该领域投资组合项目的良好起点。

建立面部识别模型

虽然人脸检测可用于在视觉输入中检测人脸,但人脸识别更进一步。该技术用于通过将人脸与现有数据库进行匹配来验证一个人的身份。

您可以尝试建立一个面部识别模型,在人群中识别特定的面部(甚至可能是您的面部)。

这项任务比人脸检测稍微具有挑战性,因为模型必须在许多数据样本上进行训练,然后才能区分人。

在建立人脸识别模型之前,您可能还需要执行预处理技术,例如降噪和图像变换。

如果这些概念对您来说很陌生,请不要担心!您可以通过参加我们的Python 图像处理课程了解有关图像处理的所有知识。

获得领域专业知识

图像和视频处理广泛应用于安全、零售、医疗保健和制造业等各个领域。

如果你想成为一名计算机视觉专家,你首先需要了解这些行业使用的数据类型。领域专业知识将使你更容易在现实场景中标记、转换和训练数据集。

首先,您可以参加我们的Python 生物医学图像分析课程。该课程将教您如何处理 CT 扫描图像、分割心脏 MRI 时间序列以及确定阿尔茨海默病是否会改变大脑结构。

这些概念将使您具备进入生物医学成像领域所需的技能。

相关推荐

Python 数据分析——利用Pandas进行分组统计

话说天下大势,分久必合,合久必分。数据分析也是如此,我们经常要对数据进行分组与聚合,以对不同组的数据进行深入解读。本章将介绍如何利用Pandas中的GroupBy操作函数来完成数据的分组、聚合以及统计...

python数据分析:介绍pandas库的数据类型Series和DataFrame

安装pandaspipinstallpandas-ihttps://mirrors.aliyun.com/pypi/simple/使用pandas直接导入即可importpandasas...

使用DataFrame计算两列的总和和最大值_[python]

【如果对您有用,请关注并转发,谢谢~~】最近在处理气象类相关数据的空间计算,在做综合性计算的时候,DataFrame针对每列的统计求和、最大值等较为方便,对某行的两列或多列数据进行求和与最大值等的简便...

8-Python内置函数

Python提供了丰富的内置函数,这些函数可以直接使用而无需导入任何模块。以下是一些常用的内置函数及其示例:1-print()1-1-说明输出指定的信息到控制台。1-2-例子2-len()2-1-说...

Python中函数式编程函数: reduce()函数

Python中的reduce()函数是一个强大的工具,它通过连续地将指定的函数应用于序列(如列表)来对序列(如列表)执行累积操作。它是functools模块的一部分,这意味着您需要在使用它之...

万万没想到,除了香农计划,Python3.11竟还有这么多性能提升

众所周知,Python3.11版本带来了较大的性能提升,但是,它具体在哪些方面上得到了优化呢?除了著名的“香农计划”外,它还包含哪些与性能相关的优化呢?本文将带你一探究竟!作者:BeshrKay...

最全python3.11版12类75个内置函数大全

获取全部内置函数:importbuiltins#导入模块yc=[]#异常属性nc=[]#不可调用fn=[]#内置函数defll(ty=builtins):...

软件测试笔试题

测试工程师岗位,3-5年,10-14k1.我司有一款产品,类似TeamViewer,向日葵,mstsc,QQ远程控制产品,一个PC客户端产品,请设想一下测试要点。并写出2.写出常用的SQL语句8条,l...

备战各大互联网巨头公司招聘会,最全Python面试大全,共300题

前言众所周知,越是顶尖的互联网公司在面试这一part的要求就越高,需要你有很好的技术功底、项目经验、一份漂亮的简历,当然还有避免不了的笔试过关。对于Python的工程师来说,全面掌握好有关Python...

经典 SQL 数据库笔试题及答案整理

马上又是金三银四啦,有蛮多小伙伴在跳槽找工作,但对于年限稍短的软件测试工程师,难免会需要进行笔试,而在笔试中,基本都会碰到一道关于数据库的大题,今天这篇文章呢,就收录了下最近学员反馈上来的一些数据库笔...

用Python开发日常小软件,让生活与工作更高效!附实例代码

引言:Python如何让生活更轻松?在数字化时代,编程早已不是程序员的专属技能。Python凭借其简洁易学的特点,成为普通人提升效率、解决日常问题的得力工具。无论是自动化重复任务、处理数据,还是开发个...

太牛了!102个Python实战项目被我扒到了!建议收藏!

挖到宝了!整整102个Python实战项目合集,从基础语法到高阶应用全覆盖,附完整源码+数据集,手把手带你从代码小白变身实战大神!这波羊毛不薅真的亏到哭!超全项目库,学练一站式搞定这份资...

Python中的并发编程

1.Python对并发编程的支持多线程:threading,利用CPU和IO可以同时执行的原理,让CPU不会干巴巴等待IO完成。多进程:multiprocessing,利用多核CPU...

Python 也有内存泄漏?

1.背景前段时间接手了一个边缘视觉识别的项目,大功能已经开发的差不多了,主要是需要是优化一些性能问题。其中比较突出的内存泄漏的问题,而且不止一处,有些比较有代表性,可以总结一下。为了更好地可视化内存...

python爬虫之多线程threading、多进程、协程aiohttp批量下载图片

一、单线程常规下载常规单线程执行脚本爬取壁纸图片,只爬取一页的图片。importdatetimeimportreimportrequestsfrombs4importBeautifu...

取消回复欢迎 发表评论: