计算机视觉学习指南（划分为20个大类）

计算机视觉的知识领域广泛而庞杂，涵盖了众多重要的方向和技术。为了更好地组织这些知识，我们需要遵循无交叉无重复（Mutually Exclusive Collectively Exhaustive，MECE）的原则，并采用循序渐进的方式进行分类和划分。

按照无交叉无重复的原则，我们将计算机视觉划分为20个重要的方向，每个方向都具有明确的定义和特定的应用领域。通过这种划分方式，可以确保每个方向都在整个计算机视觉领域中是独立且不重叠的。

同时，我们也要遵循循序渐进的原则，按照知识的难易程度和学习的先后顺序对这些方向进行排序。这样的划分方式可以使学习者能够逐步掌握计算机视觉的基础知识，从而更好地理解和应用更高级的概念和技术。

通过这样的划分方式，我们可以更系统地学习和掌握计算机视觉的知识，为进一步的研究和应用奠定坚实的基础。这个文章将帮助读者更好地理解计算机视觉的范围和复杂性，并为其进一步深入研究和学习提供了方向和指导。无论是对于新手入门还是对于专业人士的深入了解，这个文章都将是一个有价值的起点。

20个方向

可以将计算机视觉领域划分为以下20个主要方向：

图像采集: 解释数字图像的产生和传感器的工作原理，如CCD和CMOS。
预处理: 包括降噪、增强、滤波等，目的是改进图像数据以便于进一步的处理。
特征提取: 提取图像的关键特征，例如边缘、角点、纹理和颜色特征。
物体检测: 识别和定位图像中的物体，如Haar级联、SSD和YOLO。
图像分割: 将图像分割成多个部分或物体，如阈值处理、区域生长、分水岭算法。
模式识别: 学习将物体分类到不同的类别，如SVM、决策树和神经网络。
目标跟踪: 追踪视频序列中动态物体的位置，常涉及滤波技术如卡尔曼滤波器和粒子滤波器。
3D重建: 从视频或多视图图像中重建三维场景，包括立体视觉和结构光等技术。
光流和运动分析: 估计视频序列中的物体或相机的运动。
人脸识别: 识别和验证图像中人脸的身份，使用特征如Eigenfaces、Fisherfaces或深度学习。
手势识别: 识别人的手势并进行相应的交互。
场景理解: 识别和解释场景中的多个物体及其相互关系和环境语境。
深度估计: 通过单目或多目方法估计场景中物体的深度信息。
计算机视觉与增强现实: 结合现实世界与虚拟图像，为增强现实应用提供视觉内容。
人员重识别和监控: 在多摄像头系统中追踪和识别个体。
机器视觉: 用于制造业中质量控制、组装线自动化和工业检测。
图像恢复: 重建图像中退化部分，如去模糊和超分辨率技术。
医学图像处理: 在诊断和治疗中分析医学图像，如MRI、CT扫描。
视频处理与分析: 视频压缩、编码和内容分析。
计算机视觉软件工具和框架: 介绍如OpenCV、TensorFlow等用于计算机视觉的库和框架。

在学习时，每个大类可以通过具体的应用案例、算法介绍和实际演示来更加形象地介绍给学员，并结合最新的研究趋势和案例研究，更好地理解计算机视觉在现实世界的应用和潜力。

我的图书

下面两本书欢迎大家参考学习。

OpenCV轻松入门

李立宗，OpenCV轻松入门，电子工业出版社，2023
本书基于面向 Python 的 OpenCV(OpenCV for Python)，介绍了图像处理的方方面面。本书以 OpenCV 官方文档的知识脉络为主线，并对细节进行补充和说明。书中不仅介绍了 OpenCV 函数的使用方法，还介绍了函数实现的算法原理。

在介绍 OpenCV 函数的使用方法时，提供了大量的程序示例，并以循序渐进的方式展开。首先，直观地展示函数在易于观察的小数组上的使用方法、处理过程、运行结果，方便读者更深入地理解函数的原理、使用方法、运行机制、处理结果。在此基础上，进一步介绍如何更好地使用函数处理图像。在介绍具体的算法原理时，本书尽量使用通俗易懂的语言和贴近生活的实例来说明问题，避免使用过多复杂抽象的公式。

本书适合计算机视觉领域的初学者阅读，包括在校学生、教师、专业技术人员、图像处理爱好者。
本书第1版出版后，深受广大读者朋友的喜爱，被很多高校选为教材，目前已经累计重印9次。为了更好地方便大家学习，对本书进行了修订。
在这里插入图片描述

计算机视觉40例

李立宗，计算机视觉40例，电子工业出版社，2022
近年来，我深耕计算机视觉领域的课程研发工作，在该领域尤其是OpenCV-Python方面积累了一点儿经验。因此，我经常会收到该领域相关知识点的咨询，内容涵盖图像处理的基础知识、OpenCV工具的使用、深度学习的具体应用等多个方面。为了更好地把所积累的知识以图文的形式分享给大家，我将该领域内的知识点进行了系统的整理，编写了本书。希望本书的内容能够对大家在计算机视觉方向的学习有所帮助。
本书以OpenCV-Python（the Python API for OpenCV）为工具，以案例为载体，系统介绍了计算机视觉从入门到深度学习的相关知识点。
本书从计算机视觉基础、经典案例、机器学习、深度学习、人脸识别应用等五个方面对计算机视觉的相关知识点做了全面、系统、深入的介绍。书中共介绍了40余个经典的计算机视觉案例，其中既有字符识别、信息加密、指纹识别、车牌识别、次品检测等计算机视觉的经典案例，也包含图像分类、目标检测、语义分割、实例分割、风格迁移、姿势识别等基于深度学习的计算机视觉案例，还包括表情识别、驾驶员疲劳监测、易容术、识别年龄和性别等针对人脸的应用案例。
在介绍具体的算法原理时，本书尽量使用通俗易懂的语言和贴近生活的示例来说明问题，避免使用复杂抽象的公式来介绍。
本书适合计算机视觉领域的初学者阅读，适于在校学生、教师、专业技术人员、图像处理爱好者使用。

在这里插入图片描述