【深度学习】2.视觉问题与得分函数

计算机视觉任务

image-20250118192415758

可以通过神经网络搜索是什么类别的动物。

image-20250118192518799

图像实际就是含有数值的三维矩阵。

像素值从0-255可以表示亮度递增的参数。数字越大,像素点越亮。

最后的3表示三个颜色通道,常见的如JPG、RGB等。

image-20250118192833762

现实场景容易发生各种遮蔽现象。

image-20250118192928952

计算机判断实际已经超越人眼。

因此深度学习需要大量的遮蔽类的数据作为依据,用来判断之后的图片是不是遮蔽的,这就是深度学习最需要的东西。你让他解决什么问题,就给他传入什么数据就可以了。

视觉任务遇到的问题

image-20250118193249581

image-20250118193312130

k=3时,算最近的三个像素块,哪个多绿点就变成哪个,因此绿色的点属于三角。即周围什么多他就是什么,这就是K近邻算法。

K=5时,范围内临近的方块变多,因此k=3与k=5结果是不一样的。

image-20250118193716777

用K近邻对图像进行分类:

image-20250118193951392

image-20250118194256579

矩阵对应元素相减后,得到B矩阵,B矩阵的元素数值之和作为一个判断标准,数值越小,表示测试image越像训练image。

选择最小的前一部分数据进行分类。

image-20250118194426983

有几张将车识别成了马,可以发现有些类别做的好,有些类别做的不好,所以存在问题。

image-20250118194524643

可以发现这类边框都是同类型的,但是主题不一样。因此在设计算法时,应该注重哪里是主体,哪里是边框或者背景。因此:

1

K近邻不知道哪里是主体,哪里是背景。

得分函数(神经网络)

image-20250118195332346

共32×32×3=3072个像素点(特征),像素点用f中的x表示;每个像素点的重要性都不一样,比如眼睛这个像素点对判断这个是猫起了促进的作用,背景这个像素点对判断这个是猫起了抑制的作用。所以得出,每个像素点对于当前图像的重要程度都不一样,重要程度用f中的W表示权重参数。0

因此,3072个像素点x对应3072个权重参数W。


看下当前这个式子:

image-20250118195921872

32×32×3=3072×1,即可以把猫这个图像看成3072行1列的矩阵。

对于公式, f ( x , W ) = W x + b f(x,W)=Wx+b f(x,W)=Wx+b

  • 首先Wx,W就是每一类物体的权重,因此可以用10个W来代替猫,狗,飞机,大炮…等十个物体,如下计算,通过矩阵运算得出猫,狗…等十个物体的最终信息10×1型矩阵。

image-20250120002212648

  • 对于b,叫它偏置参数。通常情况下,W(权重项)对结果起到决定性作用,而对于b(偏置项)则起到了一个微调的操作。所谓微调,接上面举例,就是将Wx的结果即10×1的矩阵再加上一个10×1的矩阵b,b的每一项对应一个物体,b矩阵中元素之间没有任何关系。

image-20250120002947351

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69003.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM面试题解,垃圾回收之“分代回收理论”剖析

一、什么是分代回收 我们会把堆内存中的对象间隔一段时间做一次GC(即垃圾回收),但是堆内存很大一块,内存布局分为新生代和老年代、其对象的特点不一样,所以回收的策略也应该各不相同 对于“刚出生”的新对象&#xf…

从根源分析,调试,定位和解决MacOS ld: unsupported tapi file type ‘!tapi-tbd‘ in YAML file

你要是遇到同样错误,找一圈都没有解决,建议认真读一下本文,这个应该是最终极的解决办法,从原理上剖析了产生的原因,同时给出来了调试和定位的办法。 maccos使用brew安装了一个gcc14, 结果编译一个最简单的程序都报错&a…

单片机-STM32 IIC通信(OLED屏幕)(十一)

一、屏幕的分类 1、LED屏幕: 由无数个发光的LED灯珠按照一定的顺序排列而成,当需要显示内容的时候,点亮相关的LED灯即可,市场占有率很高,主要是用于户外,广告屏幕,成本低。 LED屏是一种用发光…

Windows cmd常用命令

文章目录 Windows cmd常用命令一、引言二、文件和目录操作1、查看和切换目录2、文件和目录的创建与删除 三、系统信息与网络配置1、系统信息2、网络配置 四、使用示例五、总结 Windows cmd常用命令 一、引言 Windows 命令提示符(cmd)是一个强大的工具&a…

snippets router pinia axios mock

文章目录 补充VS Code 代码片段注册自定义组件vue routerpinia删除vite创建项目时默认的文件axiosmock3.0.x版本的 viteMockServe 补充 为文章做补充:https://blog.csdn.net/yavlgloss/article/details/140063387 VS Code 代码片段 为当前项目创建 Snippets {&quo…

Spring MVC中HandlerInterceptor和Filter的区别

目录 一、处理阶段 二、功能范围 三、参数访问 四、配置方式 五、使用场景说明 在Spring MVC中,HandlerInterceptor和Filter都是用于拦截请求的重要组件,但它们在多个方面存在显著的差异。本文将详细解析这两种拦截机制的区别,并结合使用…

在K8S中,如何使用EFK实现日志的统一管理?

在Kubernetes中,EFK是一种常见的日志统一管理方案。EFK堆栈允许你收集、存储、搜素、分析和可视化容器应用程序的日志。下面是如何在Kubernetes中使用EFK实现日志统一管理的详细步骤: 部署Elasticsearch elasticsearch是一个分布式、RESTful风格的搜索…

神经网络基础 | 给定条件下推导对应的卷积层参数

神经网络基础 | 给定条件下推导对应的卷积层参数 按照 PyTorch 文档中 给定的设置: H o u t ⌊ H i n 2 padding [ 0 ] − dilation [ 0 ] ( kernel_size [ 0 ] − 1 ) − 1 stride [ 0 ] 1 ⌋ H_{out} \left\lfloor\frac{H_{in} 2 \times \text{padding}[0]…

欧拉(Euler 22.03)安装ProxySQL

下载离线安装包 proxysql-2.0.8-1-centos7.x86_64.rpm 链接: https://pan.baidu.com/s/1R-SJiVUEu24oNnPFlm9wRw 提取码: sa2w离线安装proxysql yum localinstall -y proxysql-2.0.8-1-centos7.x86_64.rpm 启动proxysql并检查状态 systemctl start proxysql 启动proxysql syste…

Sharding-JDBC 5.4.1+SpringBoot3.4.1+MySQL8.4.1 使用案例

最近在升级 SpringBoot 项目,原版本是 2.7.16,要升级到 3.4.0 ,JDK 版本要从 JDK8 升级 JDK21,原项目中使用了 Sharding-JDBC,版本 4.0.0-RC1,在升级 SpringBoot 版本到 3.4.0 之后,服务启动失败…

MacOS/C/C++下怎样进行软件性能分析(CPU/GPU/Memory)

在macOS环境下进行C/C软件性能分析,可以使用多种工具和技术来测量和优化CPU、GPU和内存的性能。macOS提供了丰富的性能分析工具,如Instruments、gprof、Perf、以及NVIDIA和Intel的专用工具。下面详细介绍了实现思想和操作方法。 1. 性能分析的目标 CPU…

WPS计算机二级•幻灯片的基础操作

听说这是目录哦 PPT的正确制作步骤🛣️认识PPT界面布局🏜️PPT基础操作 快捷键🏞️制作PPT时 常用的快捷技巧🏙️快速替换PPT的 文本字体🌃快速替换PPT 指定文本内容🌅能量站😚 PPT的正确制作步…

vue3组件传值具体使用

问: left.vue文件调用接口获取了后端返回的urlLink字段,我该怎么传递给总的父组件index.vue中,我需要点击父组件的一个按钮来触发跳转? 回答: 在 Vue 3 中使用 TypeScript 和 setup 语法糖时,可以通过 e…

easyexcel读取写入excel easyexceldemo

1.新建springboot项目 2.添加pom依赖 <name>excel</name> <description>excelspringboot例子</description><parent> <groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId&…

考研机试题:打印数字菱形

描述 打印一个由数字 0∼n 构成的菱形。 其中 n 位于正中心&#xff0c;数字靠近边缘时逐个递减&#xff0c;直至为 0。 例如&#xff0c;当 n5时&#xff0c;图形如下所示&#xff1a; 00 1 00 1 2 1 00 1 2 3 2 1 00 1 2 3 4 3 2 1 0 0 1 2 3 4 5 4 3 2 1 00 1 2 3 4 3 2 …

Neural networks 神经网络

发展时间线 基础概念 多层神经网络结构 神经网络中一个网络层的数学表达 TensorFlow实践 创建网络层 神经网络的创建、训练与推理 推理 推理可以理解为执行一次前向传播 前向传播 前向传播直观数学表达 前向传播直观数学表达的Python实现 前向传播向量化实现 相关数学知识…

【探索 Kali Linux】渗透测试与网络安全的终极操作系统

探索 Kali Linux&#xff1a;渗透测试与网络安全的终极操作系统 在网络安全领域&#xff0c;Kali Linux 无疑是最受欢迎的操作系统之一。无论是专业的渗透测试人员、安全研究人员&#xff0c;还是对网络安全感兴趣的初学者&#xff0c;Kali Linux 都提供了强大的工具和灵活的环…

AR智慧点巡检系统探究和技术方案设计

一、项目背景 随着工业生产规模的不断扩大和设备复杂度的提升&#xff0c;传统的人工点巡检方式效率低下、易出错&#xff0c;难以满足现代化企业对设备运行可靠性和安全性的要求。AR&#xff08;增强现实&#xff09;技术的发展为点巡检工作带来了新的解决方案&#xff0c;通…

AI如何帮助解决生活中的琐碎难题?

引言&#xff1a;AI已经融入我们的日常生活 你有没有遇到过这样的情况——早上匆忙出门却忘了带钥匙&#xff0c;到了公司才想起昨天的会议资料没有打印&#xff0c;或者下班回家还在纠结晚饭吃什么&#xff1f;这些看似微不足道的小事&#xff0c;往往让人疲惫不堪。而如今&a…

用Python绘制一只懒羊羊

目录 一、准备工作 二、Turtle库简介 三、绘制懒羊羊的步骤 1. 导入Turtle库并设置画布 2. 绘制头部 3. 绘制眼睛 4. 绘制嘴巴 5. 绘制身体 6. 绘制四肢 7. 完成绘制 五、运行代码与结果展示 六、总结 在这个趣味盎然的技术实践中,我们将使用Python和Turtle图形…