制作网站什么制作软件/互联网推广平台

制作网站什么制作软件,互联网推广平台,个人怎么见个网站,国内网站没备案今天看的是《Object Detection with Deep Learning: A Review》 目录 一、摘要 1.1 原文 1.2 翻译 二、介绍 2.1 信息区域选择 2.2 特征提取 2.3 分类 三、深度学习的简要回顾 3.1 历史、诞生、衰落和繁荣 3.2 CNN架构和优势 一、摘要 1.1 原文 Due to object dete…

今天看的是《Object Detection with Deep Learning: A Review》


目录

一、摘要

1.1 原文

1.2 翻译

二、介绍

2.1 信息区域选择

2.2 特征提取

2.3 分类

三、深度学习的简要回顾

3.1 历史、诞生、衰落和繁荣

3.2 CNN架构和优势


一、摘要

1.1 原文

Due to object detection’s close relationship with video analysis and image understanding, it has attracted much research attention in recent years. Traditional object detection methods are built on handcrafted features and shallow trainable architectures. Their performance easily stagnates by constructing complex ensembles which combine multiple low-level image features with high-level context from object detectors and scene classifiers. With the rapid development in deep learning, more powerful tools, which are able to learn semantic, high-level, deeper features, are introduced to address the problems existing in traditional architectures. These models behave differently in network architecture, training strategy and optimization function, etc. In this paper, we provide a review on deep learning based object detection frameworks. Our review begins with a brief introduction on the history of deep learning and its representative tool, namely Convolutional Neural Network (CNN). Then we focus on typical generic object detection architectures along with some modifications and useful tricks to improve detection performance further. As distinct specific detection tasks exhibit different characteristics, we also briefly survey several specific tasks, including salient object detection, face detection and pedestrian detection. Experimental analyses are also provided to compare various methods and draw some meaningful conclusions. Finally, several promising directions and tasks are provided to serve as guidelines for future work in both object detection and relevant neural network based learning systems.

1.2 翻译

由于目标检测与视频分析和图像理解的密切关系,近年来引起了人们的广泛关注。传统的目标检测方法是建立在手工特征和浅层可训练架构上的。通过构建复杂的集成,将多个低级图像特征与来自目标检测器和场景分类器的高级上下文相结合,它们的性能很容易停滞不前。随着深度学习的快速发展,越来越多功能强大的工具被引入,这些工具能够学习语义的、高层次的、更深层次的特征,以解决传统架构中存在的问题。这些模型在网络架构、训练策略和优化功能等方面表现不同。本文回顾了基于深度学习的目标检测框架。我们的回顾首先简要介绍了深度学习的历史及其代表工具,即卷积神经网络(CNN)。然后,我们重点讨论了典型的通用目标检测体系结构以及一些改进和有用的技巧,以进一步提高检测性能。由于不同的特定检测任务具有不同的特征,我们还简要介绍了几种特定的检测任务,包括显著目标检测、人脸检测和行人检测。实验分析比较了各种方法,得出了一些有意义的结论。最后,提出了几个有前途的方向和任务,为未来目标检测和相关的基于神经网络的学习系统的工作提供指导。

二、介绍

为了理解图像,我们要对图像进行分类和精确定位其中目标的概念和位置,这就是“目标检测”。其中包含许多子任务:人脸检测、行人检测、骨架检测等等。

目标检测作为计算机视觉的基础问题之一,能够为图像和视频的语义理解提供有价值的信息,涉及到图像分类,人类行为分析,人脸识别,自动驾驶等诸多应用。

然而,由于视角、姿态、遮挡和光照条件的巨大变化,通过额外的物体定位任务很难完美地完成目标检测。近年来,这一领域受到了广泛的关注。目标检测的问题定义是确定物体在给定图像中的位置(物体定位)和每个物体属于哪个类别(物体分类)。因此传统目标检测模型的流水线主要分为三个阶段:信息区域选择、特征提取和分类。

2.1 信息区域选择

由于不同的物体可能出现在图像的任何位置,并且具有不同的长宽比或大小,因此使用多尺度滑动窗口扫描整个图像是一种自然的选择。由于候选窗口数量多,计算成本高,产生过多冗余窗口。然而,如果只应用固定数量的滑动窗口模板,可能会产生不满意的区域。

2.2 特征提取

为了识别不同的对象,我们需要提取能够提供语义和鲁棒的表示的视觉特征。然而,由于外观、光照条件和背景的多样性,很难手动设计一个鲁棒的的特征描述符来完美地描述所有类型的物体。

2.3 分类

目标检测中,需要使用分类器将目标与其他类进行区分,并表示的更具有层次性、语义性和信息量,以便于视觉的识别。常见分类器有支持向量机(Support Vector Mechine,SVM)、AdBoost和可变形零件模型(Deformable Part-based Model,DPM)。其中DPM比较灵活,可以结合物体的部分与变形的代价处理严重变形的情况。它还借助了图形模型,将低级特征和各部件分解相结合。

本篇文章系统介绍通用目标检测、显著性目标检测、人脸检测和行人检测几个应用领域代表模型和不同特点。这几类模型关系如下:

通常而言,基于基础的CNN架构,采用边界框回归实现通用目标检测,局部对比度增强和像素级分割实现显著性目标检测。人脸检测和行人检测通过多尺度自适应和多特征融合/增强森林实现。上图中虚线表示相应的域在一定条件下相互转换。行人和人脸具有相同规则结构,一般物体和场景图像变化更为复杂。不同图像需要不同的深度模型。

三、深度学习的简要回顾

3.1 历史、诞生、衰落和繁荣

深度学习即为具有深层结构的神经网络。神经网络最初用于模拟人类大脑系统,之后由于训练过拟合,数据缺乏和计算能力的限制,神经网络与21世纪初就过时了。深度学习与2006年流行,最初在语音识别方面得到突破,其繁荣归因于以下因素:

  • 大规模带注释的训练数据出现,如ImageNet,展示了强大的学习能力
  • 快速开发高性能并行计算系统,如GPU集群
  • 网络结构设计和训练策略方面的重大进展。dropout和数据增强的出现缓解了数据过拟合问题,采用批处理归一化(BatchNormalization,BN)神经网络训练变得高效。各种网络结构也被提出以提高性能。

3.2 CNN架构和优势

CNN是最有代表性的深度学习模型,典型的CNN架构被称为VGG16。它的每一层被称为一个特征图,输入特征映射是不同颜色的通道(如RGB三通道)像素强度3D矩阵。任意一个内层的特征图都是一个多通道图像。“像素”就可以称为一个特定的特征。每个神经元与前一层(感受野)的小部分相邻神经元相连。在特征映射时进行不同的转换,如过滤、池化等。滤波(卷积)操作将滤波矩阵(学习权值)与神经元感受野的值进行卷积,并采用非线性函数(如sigmoid,ReLU)获得最终响应。池化操作如max池化、平均池化、l2池化和局部对比度归一化,将感受野响应总结为一个值,以产生更具有鲁棒性的特征描述。

卷积和池化之间的交错,可以构造一个初始的特征层次结构,再添加几个完全连接层(Full Connection,FC)以监督方式进行微调,适应不同视觉任务。经典VGG16具有13个卷积层(Conv),3个全连接层,3个最大池化层和一个softmax分类层。卷积特征图分辨率通过3*3的滤波窗口生成的。特征图分辨率通过两步最大池化层降低。训练后网络可以处理任意与训练样本大小相同的测试图像。若大小不同,则需重新缩放和裁剪。

CNN相比于传统方法的优势总结如下:

  • 层次化特征表示,通过层次化多阶段结构学习到的像素到高级语义特征多层次表示,自动从数据中学习,并通过多层次非线性映射解除输入数据的隐藏因素
  • 深层架构提高指数级增长的表达能力
  • CNN架构提供联合优化多个相关任务的机会(Fast RCNN将分类和边界框回归结合成多任务学习方式)
  • CNN使得一些经典计算机视觉挑战可以被重塑为高维数据转换问题,并从不同角度解决

因此CNN也被用于许多领域,如图像超分辨率重建、图像分类、图像检索、人脸识别和视频分析等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899577.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Arthas线上问题诊断器

Arthas是Alibaba开源的java诊断工具 解决问题 这个类从哪个jar 包加载的?为什么会报各种相关的Exception? 遇到问题无法在线上debug,不能直通过加载日志再重新发布 有什么办法可以监控到JVM的实时运行状态? …

[Lc5_dfs+floodfill] 简介 | 图像渲染 | 岛屿数量

目录 0.floodfill算法简介 1.图像渲染 题解 2.岛屿数量 题解 之前我们在 bfs 中有介绍过[Lc15_bfsfloodfill] 图像渲染 | 岛屿数量 | 岛屿的最大面积 | 被围绕的区域,现在我们来看看 dfs 又是如何解决的呢 0.floodfill算法简介 floodfill算法又叫洪水灌溉或者…

JVM类加载器详解

文章目录 1.类与类加载器2.类加载器加载规则3.JVM 中内置的三个重要类加载器为什么 获取到 ClassLoader 为null就是 BootstrapClassLoader 加载的呢? 4.自定义类加载器什么时候需要自定义类加载器代码示例 5.双亲委派模式类与类加载器双亲委派模型双亲委派模型的执行…

【SPP】RFCOMM 层在SPP中互操作性要求深度解析

蓝牙串口协议(SPP)通过 RFCOMM 协议实现 RS232 串口仿真,其互操作性是设备互联的关键。本文基于蓝牙核心规范,深度解析 RFCOMM 层的能力矩阵、信号处理、流控机制及实战开发,结合状态机、流程图和代码示例,…

Gossip协议:分布式系统中的“八卦”传播艺术

目录 一、 什么是Gossip协议?二、 Gossip协议的应用 💡三、 Gossip协议消息传播模式详解 📚四、 Gossip协议的优缺点五、 总结: 🌟我的其他文章也讲解的比较有趣😁,如果喜欢博主的讲解方式&…

【C++初阶】----模板初阶

1.泛型函数 泛型编程:编写与类型无关的通用代码,是代码复用的一种手段。模板是泛型编程的基础。 2.函数模板 2.1函数模板的概念 函数模板代表了一个函数家族,该函数模板与类型无关,在使用时被参数化,根据实参类型…

git-- github的使用--账户和本地连接

以下指令在git 执行bash 流程:先看有没有密钥; 没有的话,在电脑生成密钥对,公钥复制到github; 要想使用https,配置令牌,注意令牌有期限问题,连接不了有可能是期限问题 一个电脑对…

Angular由一个bug说起之十五:自定义基于Overlay的Tooltip

背景 工具提示(tooltip)是一个常见的 UI 组件,用于在用户与页面元素交互时提供额外的信息。由于angular/material/tooltip的matTooltip只能显示纯文本,所以我们可以通过自定义Directive来实现一个灵活且功能丰富的tooltip Overlay…

搭建QNX Software Center的Docker环境

背景 本人使用 Ubuntu Server 22.04 服务器,所以没有图形界面,而 QNX Software Center 需要图形界面。为了保证服务器环境的整理,计划使用Docker部署QNX Software Center 一瓶安装图形界面。本方既是实现方案的记录。 资源 Dockerfile&…

C#/.NET/.NET Core技术前沿周刊 | 第 31 期(2025年3.17-3.23)

前言 C#/.NET/.NET Core技术前沿周刊,你的每周技术指南针!记录、追踪C#/.NET/.NET Core领域、生态的每周最新、最实用、最有价值的技术文章、社区动态、优质项目和学习资源等。让你时刻站在技术前沿,助力技术成长与视野拓宽。 欢迎投稿、推荐…

【STM32】WDG看门狗(学习笔记)

学习来源----->江协科技STM32 WDG简介 WDG(Watchdog)看门狗看门狗可以监控程序的运行状态,当程序因为设计漏洞、硬件故障、电磁干扰等原因,出现卡死或跑飞现象时,看门狗能及时复位程序,避免程序陷入长…

2023第十四届蓝桥杯大赛软件赛国赛C/C++ 大学 B 组(真题题解)(C++/Java题解)

本来想刷省赛题呢,结果一不小心刷成国赛了 真是个小迷糊〒▽〒 但,又如何( •̀ ω •́ )✧ 记录刷题的过程、感悟、题解。 希望能帮到,那些与我一同前行的,来自远方的朋友😉 大纲: 一、子2023-&#xff…

CSS学习笔记6——网页布局

目录 一、元素的浮动属性、清除浮动 清除浮动的其他方法 1、使用空标签清除浮动影响 2、使用overflow属性清除浮动 3、使用伪元素清除浮动影响 原理 overflow属性 二、元素的定位 1、相对定位 2、绝对定位 ​编辑 3、固定定位 z-index层叠等级属性 一、元素的浮动…

Linux之数据链路层

Linux之数据链路层 一.以太网1.1以太网帧格式1.2MAC地址1.3MTU 二.ARP协议2.1ARP协议工作流程2.2ARP协议格式 三.NAT技术四.代理服务4.1正向代理4.2反向代理 五.四大层的学习总结 一.以太网 在我们学习完了网络层后我们接下来就要进入数据链路层的学习了,在学习完网…

MySQL的基础语法2(函数-字符串函数、数值函数、日期函数和流程函数 )

目录 一、字符串函数 1.常见字符串函数 ​编辑 2.字符串函数的基本使用 3.字符串函数的数据库案例演示 二、数值函数 1.常见数值函数(如下): 2.数值函数的基本使用 3.数值函数的数据库案例演示 三、日期函数 1.常见的日期函数 2.日…

全新版租赁商城小程序源码系统 源码开源支持二开+图文搭建教程

在互联网商业的浪潮中,租赁业务凭借其独特的优势,正逐渐成为市场的新宠。对于开发者而言,快速搭建一个功能完备的租赁商城小程序,不仅能满足市场需求,还能为自己的业务拓展带来新的机遇。分享一款全新版租赁商城小程序…

Cent OS7+Docker+Dify

由于我之前安装了Dify v1.0.0,出现了一些问题:无法删除,包括:知识库中的文件、应用、智能体、工作流,都无法删除。现在把服务器初始化,一步步重新安装,从0到有。 目录 1、服务器重装系统和配置…

AI的未来:机遇、挑战与发展方向

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言 人工智能(AI)已经成为当今世界最具革命性的技术之一,它正在深刻改变各个行业&#x…

使用vue cli 5.0 在vscode中运行vue命令报错

1、运行 vue -- version 报错 2、在cmd 命令行 执行 vue --version 正常 3、在终端中输入 get-ExecutionPolicy,查看当前权限 4、执行 set-executionpolicy remotesigned 命令设置为可用模式,但是报错 5、使用管理员打开power shell 执行 G…

瑞芯微 RKrga接口 wrapbuffer_virtualaddr 使用笔记

一、源码 官方在librga中给了很多 demo 以供参考&#xff0c;例如 imresize 操作&#xff1a; /** Copyright (C) 2022 Rockchip Electronics Co., Ltd.* Authors:* YuQiaowei <cerf.yurock-chips.com>** Licensed under the Apache License, Version 2.0 (the &qu…