目录
一、引言
二、深度学习基本概念
三、损失函数
一、引言
1、在不同的监控检测同一行人,实现行人的监测。
2、文本描述行人特征。根据文本描述寻找行人。
是图像检索问题,检索对象是行人。
标本图像与待查询图像相似度对比,相似度从高到低排名。
怎么找相似度?可以用特征。如目标行人上半身白色,下半身黑色。
或者完善特征,一个穿白色T-shirt短袖,黑色长裤,背红色书包留短发的女人。
所有图像形成特征向量,
训练集与测试集来自同一场景。如都是在冬天同一路口的行人。
挑战:行人近大远小,近图像质量高。
背景不同:有人被车挡住
光照不同:白天黑夜,晴雨天
不同角度:正侧面、有高有低
第一个问题没记下来
域(domain)自适应问题,训练集与测试集在不同的场景之中。
如何经过少量训练,实现精度的大幅提升?
上面四个挑战再加两个穿衣不一样、人种不一样。
无监督行人识别问题,没有准确标记数据。
域泛化行人识别问题
网络多目标跟踪MOT问题
关键:物体检测、人物特征处理、同一人匹配
部分人部分时间被挡住了,实时系统。(要快)
一个人每时每刻的追踪:多目标多摄像头匹配问题。
二、深度学习基本概念
有监督问题(分类、回归)
无监督学习(聚类、数据降维)
人工神经网络:输入层、隐含层、输出层
DNN CNN 迁移学习
三、损失函数
Cross-entropy loss
Triplet Loss
后面听不懂了,想象不出具体的模型。
Part-based Convolutional Baseline PCB RPP
SPGAN