机器学习—例子:图像识别

在上篇文章中,在一个需求预测示例中看到了神经网络是如何工作的,那么如何将类似类型的想法应用于计算机视觉应用程序。

如果你正在开发人脸识别应用程序,让我们深入研究一下。假设一个神经网络将这样的图片作为输入,并输出图片中的人的身份,这个图像是一千乘一千像素,所以它在计算机中的表示实际上是一千乘一千的网格或者也称为像素强度值的千乘千矩阵,在本例中,像素强度值或像素亮度值,从0到255,所以这里的197是像素的亮度,图像的左上角,185是像素的亮度,一个像素以上,以此类推,到214是这孩子那个图像的右下角。如果你把这些像素强度值展开 成一个矢量,你最终得到一个列表或向量,百万像素强度值百万,因为一千乘一千的平方会给你一百万个数字,所以人脸识别的问题是:你能训练一个神经网络,具有百万像素亮度值的特征矢量,并输出图片中的人的身份,所以这就是你如何建立一个神经网络来执行这项任务。

具体流程:输入图像X被馈送到这层神经元,这是第一个隐藏层,然后提取一些特征,第一个隐藏层的输出被馈送到第二个隐藏层,输出到第三层,最后到输出层,估计这个人是某个特定的人。

有趣的是,如果你观察一个被训练过的神经网络很多人脸图像,并试图可视化这些隐藏的层试图计算什么。事实证明,当你在许多人脸照片上训练一个这样的系统时,你观察隐藏层的不同神经元,找出他们可能在计算什么,这就是你可能会发现的第一个隐藏层,你可能会发现一个神经元在寻找一条垂直线或者像那样的垂直边缘,第二个神经元在寻找像这样的定向线或定向边缘,第三个神经元在那个方向寻找一条线,以此类推,所以在神经网络的最早层中,你可能会发现神经元在寻找非常短的线条或者图像中非常短的边缘,如果你看下一个隐藏层,你会发现这些神经元可能会学会将许多小的短线组合在一起,一些短的边缘段,以便寻找面部的部分,例如,每一个小方盒是神经元试图检测到东西的可视化,所以,第一个神经元看起来像是在试图检测,眼睛在图像的某一位置的存在或不存在,第二个神经元似乎在试图检测鼻子底部,当查看本例中的下一个隐藏层时,神经网络将人脸的不同部分聚集在一起,然后试着检测是否有更大更粗糙的脸型,最后检测人脸与不同脸型的对应程度,创建一组丰富的特性,然后帮助输出层尝试确定人物图片的身份。

神经网络的非凡之处在于你可以在不同的隐藏层上自己学习这些特征检测器,从来没有人告诉你它在第一层寻找短的小边缘,眼睛,鼻子和面部部位在第二层,然后第三层更完整的脸型,神经网络能够从数据中自己找出这些东西,在这个可视化中只有一个注意,第一个隐藏层的神经元看着相对较小的窗口去寻找这些边缘,然后第二,三个隐藏层在一个更大的窗口中寻找,所以这些小神经元的可视化实际上对应于图像中不同大小的区域。

如果你在不同的训练集上训练这个神经网络,在很多侧面的汽车照片上来说,相同的算法,如果被要求检测汽车,那么会在第一层学习边缘,所以非常相似,但随后他们将学会在第二层隐藏层中检测汽车部件,然后在第三个隐藏层更完整的汽车形状,所以只要给它输入不同的数据,神经网络自动学习检测非常不同的特征,从而做出汽车检测的预测,人脸识别或者任何被训练的特定任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/884899.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

别再被多线程搞晕了!一篇文章轻松搞懂 Linux 多线程同步!

前言 大家有没有遇到过,代码跑着跑着,线程突然抢资源抢疯了?其实,这都是“多线程同步”在作怪。多线程同步是个老生常谈的话题,可每次真正要处理时还是让人头疼。这篇文章,带你从头到尾掌握 Linux 的多线程…

深度学习:从神经网络到人工智能的飞跃

深度学习:从神经网络到人工智能的飞跃 深度学习(Deep Learning)是人工智能(AI)领域的一个重要分支,近年来在图像识别、自然语言处理、语音识别等领域取得了显著的进展。深度学习通过构建多层神经网络&…

华为OD机试真题-推荐多样性

题目描述 推荐多样性需要从多个列表中选择元素,一次性要返回N屏数据(窗口数量),每屏展示K个元素(窗口大小),选择策略: 各个列表元素需要做穿插处理,即先从第一个列表中为…

HTML、CSS 和 JavaScript 在网页设计方面的介绍

关于 HTML、CSS 和 JavaScript 在网页设计方面的介绍: HTML(超文本标记语言 - HyperText Markup Language) 结构基础:HTML 是网页内容的骨架。它通过一系列的标签来定义网页中的各种元素,比如 <html> 标签是整个页面的根标签,<head> 标签用于包含页面的元信…

对于用户密码的加密

这篇文章也是在做项目的时候使用到的内容&#xff0c;来做成一篇博客 &#xff08;一&#xff09;加密是什么&#xff1f; 我们在https中也说到了加密&#xff0c;因为https就是http加密后的产物&#xff0c;当时又说到了运营商劫持&#xff0c;然后引出加密&#xff0c;然后加…

SQL拦截(二)InnerInterceptor

一、介绍 1、简介 InnerInterceptor 接口是 MyBatis-Plus 提供的一个拦截器接口&#xff0c;用于实现一些常用的 SQL 处理逻辑。 二、API InnerInterceptor 接口继承自 MyBatis 的 Interceptor 接口&#xff0c;并添加了一些新的方法&#xff0c;用于处理 MyBatis-Plus 的特…

Hive数据库操作语法

数据类型 内部表和外部表 内部表 &#xff08;CREATE TABLE table_name ......&#xff09;未被external关键字修饰的即是内部表&#xff0c; 即普通表。 内部表又称管理表,内部表数据存储的位置由hive.metastore.warehouse.dir参数决定&#xff08;默认&#xff1a;/user/h…

2024年最新crm系统TOP10!

在当今竞争激烈的商业环境中&#xff0c;维持良好的客户关系是企业成功的关键所在。CRM&#xff08;客户关系管理&#xff09;系统已成为帮助企业优化客户关系、提高客户满意度和增加业务收入的有力工具。随着技术的不断进步&#xff0c;2024年最新的CRM系统提供了更先进的功能…

车载通信架构 --- PNC、UB与信号的关系

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 所有人的看法和评价都是暂时的,只有自己的经历是伴随一生的,几乎所有的担忧和畏惧,都是来源于自己的想象,只有你真的去做了,才会发现有多快乐。…

CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection论文解读和实验复现

背景 医学图像数据集的增长&#xff1a;随着公开的医学图像数据集数量的增加&#xff0c;自动化器官分割和肿瘤检测技术得到了显著发展。数据集的局限性&#xff1a;尽管数据集数量增加&#xff0c;但每个数据集通常规模较小&#xff0c;且存在部分标注问题。这意味着不是所有…

如何使用Varjo直接观看Blender内容

最近&#xff0c;开源的3D建模程序Blender为Varjo提供了出色的OpenXR支持&#xff0c;包括四视图和凹进渲染扩展。但是在Blender中&#xff0c;默认不启用VR场景检查。要开始使用VR场景检查&#xff0c;只需遵循以下步骤&#xff1a; 1. 下载并安装Blender 2.启用Blender VR场景…

Go 语言之搭建通用 Web 项目开发脚手架

Go 语言之搭建通用 Web 项目开发脚手架 MVC 模式 MVC 模式代表 Model-View-Controller&#xff08;模型-视图-控制器&#xff09; 模式。这种模式用于应用程序的分层开发。 Model&#xff08;模型&#xff09; - 模型代表一个存取数据的对象或 JAVA POJO。它也可以带有逻辑&…

【LeetCode】【算法】160.相交链表

Leetcode 160. 相交链表 题目描述 给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 。 思路 AB&#xff0c;一个指针&#xff0c;访问完A访问B&#xff1b;另一个指针&#…

[UUCTF 2022 新生赛]ezpop 详细题解(字符串逃逸)

知识点: php反序列化字符串逃逸 php反序列化魔术方法 构造pop链 变量引用 其实这一题还是比较简单的,只要看懂代码,并且理解为什么要用反序列化字符串逃逸,下面会详细解释 题目源码: <?php //flag in flag.php error_reporting(0); class UUCTF{public $name,$key,$…

Python爬虫基础-正则表达式!

前言 正则表达式是对字符串的一种逻辑公式&#xff0c;用事先定义好的一些特定字符、及这些特定字符的组合&#xff0c;组成一个“规则的字符串”&#xff0c;此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在&#xff0c;而非python独有。对其知识点…

从 HTTP 到 HTTPS 再到 HSTS:网站安全的演变与实践

近年来&#xff0c;随着域名劫持、信息泄漏等网络安全事件的频繁发生&#xff0c;网站安全变得越来越重要。这促使网络传输协议从 HTTP 发展到 HTTPS&#xff0c;再到 HSTS。本文将详细介绍这些协议的演变过程及其在实际应用中的重要性。 一、HTTP 协议 1.1 HTTP 简介 HTTP&…

Oracle 第15章:安全性管理

在Oracle数据库中&#xff0c;安全性管理是一个至关重要的方面&#xff0c;它确保了数据的完整性和机密性。第15章通常会涵盖用户权限、角色分配、数据库审计和安全策略等内容。下面我会概述这些主题&#xff0c;并提供一些示例来帮助理解。 用户权限与角色 用户权限 在Orac…

AI之硬件对比:据传英伟达Nvidia2025年将推出RTX 5090-32GB/RTX 5080-24GB、华为2025年推出910C/910D

AI之硬件对比&#xff1a;据传英伟达Nvidia2025年将推出RTX 5090-32GB/RTX 5080-24GB、华为2025年推出910C/910D 目录 Nvidia的显卡 Nvidia的5090/5080/4090/4080&#xff1a;据传传英伟达Nvidia RTX 5090后续推出32GB版且RTX 5080后续或推出24GB版 RTX 5090相较于RTX 4090&…

SRS:构建实时免费视频服务器的全方位指南

SRS&#xff08;Simple Realtime Server&#xff09;是一个开源的、基于MIT协议的实时视频服务器&#xff0c;以其简单、高效而著称。它支持多种流媒体协议&#xff0c;包括RTMP、WebRTC、HLS、HTTP-FLV、SRT、MPEG-DASH和GB28181等&#xff0c;使其成为直播和WebRTC领域的理想…

Go 语言的错误处理

1. 引言 在任何编程语言中,错误处理都是一个至关重要的部分。在 Go 语言中,错误处理方式独具特色,它并没有采用异常处理机制(try-catch),而是通过显式的错误返回值来处理错误。这种方式让代码更加明确、易于维护,也使得错误处理更加透明。 在这篇博客中,我们将深入探…