1.为什么要学习图像处理和计算机视觉
计算机视觉市场需求大,其是人工智能的重要分支。
计算机视觉岗位占所有AI岗位的40%。
但是,中国高校目前尚未设置计算机视觉学科己专业;学习者众多,学习分散,缺少统一教学体系;教材偏重理论,同时内容老旧。
突出问题:不知道学啥?以及学完还是不会用。
网络资源:网课众多,但缺乏系统性和循序渐进
- 讲解实例及实现为主,缺乏背景介绍,知其然而不知其所以然
- 基础知识缺乏讲解,缺乏系统性,学完例子无法推广和使用。
解决方案:“练拳又练功,掌握更轻松”-练拳不练功,到老一场空。练功不练拳,有如无舵船。
原理讲透,背景讲清,内容可视化。
- 原理讲解透彻,用图说话,减少公式。理解更轻松,掌握更透彻。
- 原理和实战紧密结合,同时给出程序实例,能知其所以然。
2.什么是计算机视觉?
计算机视觉:让计算机“看懂”图像。
计算机视觉要完成以下问题:
- 图像预处理与特征检测
- 图像分割和识别
- 2-1/2D视觉计算
- 图像理解和行为分析
- 图像推理
计算机视觉发展史:
- 起源:20世纪50年代统计模式识别,二维图像分析
- 1970’s:数字图像处理,图像结构
- 1980‘s:光流,尺度空间,多视几何,马尔可夫随机场
- 1990’s:3D重建,图切,粒子滤波
- 2000‘s:特征提取,3D建模与绘制,图像分类
- 2010’s:深度学习和目标识别、检测、分割、位姿估计、SLAM
工具:python + OpenCV安装环境
注:其中opencv的第三方库可以在清华大学开源软件镜像站找到https://pypi.tuna.tsinghua.edu.cn/simple/。
第一个程序:Hello,Lena!
import cv2 as cvfilename = 'C:/python/img/lena.jpg'
img = cv.imread(filename)
cv.imshow("Hello,Lena", img)
cv.waitKey()
cv.destroyAllWindows()
计算机视觉方向知识体系结构
Marr视觉计算理论:
- 目的:通过视觉系统,重建三维物体的形状和位置
- 初始略图(2维):过零点(zero-crossing)、短线段、端点等基元特征
- 2-1/2维:对物体形状的一些粗略描述
- 3维:对物体的三维描述