《计算机视觉度量:从特征描述到深度学习》—深度学习图像特征工程

        传统算法的图像特征分析和描述,一直贯穿图像算法的发展。2017年深度学习的出现,很多开发人员和技术人员认为,图像特征分析这个概念可以被深度学习完全取代。很长一段时间以深度学习为主的视觉方案成为主流,逐渐淡化了传统视觉的特征分析。

        随着深度学习的发展,在很多场景应用中,深度学习只能满足部分场景的需求,工程师开始逐渐对深度学习进行分析和拆解。到2020年自编码深度学习概念的出现,才开始对深度学习的图像特征编码进入深入的理解。逐渐发展出一套针对深度学习编码特征分析的方法。

        以Resnet为例,Resnet的结构主要为四个卷积层和一个线性回归层。在通过大数据ImageNet的训练过后,卷积层对1~1000的线性变量学习了一套卷积特征变换函数。通过对图像的卷积编码,获取到各卷积层输出的特征值。作为后续特征开发的重点,比如比较成功的MaskRcnn和FastRcnn模型就是在图像特征编码的后进行新的训练,完成对目标的检测和识别。以及后来针对VIT网络的YOLO模型。

        通过深度学习提取特征的方法,学术上称之为图片的深度BackOne提取。概念的提出也对深度学习的发展有了底层的根据。在2020~2022之间,工程界和学术界还是以主流的回归训练对深度学习特征进行总结和应用,衍生出很多优秀的模型。但是底层没有太大的改变,同样模型性能和场景也出现瓶颈。

        在2023年Bert(大语言模型的前身)模型的出现,采用新的数据对齐方法,对生成的深度的数据信息映射为一种人类可以理解的描述语言。这种方法就是目前我们看到的大模型时代,这也为图像分析带来了思路。最近的2024~2025年,不断出现针对图片的大模型应用,比如SAM和Dinov2,CLIP等。也开始出现生成式的图片模型的应用。也就衍生出一种非训练方式的数据对齐方案,比如Agent,MCP,RAG等技术。

        这些技术都是采用深度学习对数据的自编码,输出模型的自编码深度信息,并采用数据搜索的方式对信息进行匹配,用于更加准确的数据输出。这也是目前工业检测大模型的方法,具体的效果和应用可以DY搜索“军哥讲视觉”,或者WX搜索“军哥讲视觉”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/80166.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零部件三维激光扫描检测

制造业竞争激烈,零部件的精准检测与三维数据的高效获取,已成为企业确保产品质量、提升生产效率的核心要素。传统检测手段,往往因效率低下、精度不足,难以满足复杂零部件的检测需求。 传统零部件检测,检测人员通常是手…

KafkaSpark

Kafka Kafka基本概念 卡夫卡是一个分布式、分布订阅的消息系统,作为消息中间件使用。 设计上是一个分布式的、分区的和可复制的提交日志服务。 Kafka的优势 分布式系统,易于扩展。 高吞吐量,支持发布和订阅模式。 支持多地复制&#xff…

图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台

光伏系统产品设计PRD文档 ‌版本号‌:1.0 ‌修订日期‌:2023年10月 ‌作者‌: 一、文档概述 1.1 背景与目标 ‌行业背景‌:全球光伏装机量年增长20%,数字化运维需求迫切‌用户痛点‌:现有系统存在数据延…

Eyecare-100K:首个覆盖多模态、多任务的高质量眼科视觉指令数据集

2025-04-18 , 由浙江大学、哈尔滨工业大学、郴州市第一人民医院、新加坡国立大学等机构合作创建了 Eyecare-100K数据集,这是首个涵盖多种模态、任务和疾病的高质量眼科视觉指令数据集,为眼科智能诊断领域提供了关键资源,推动了医学视觉语言模…

CoT-Drive:利用 LLM 和思维链提示实现自动驾驶的高效运动预测

25年3月来自澳门大学和 MIT 的论文“CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting”。 准确的运动预测对于安全的自动驾驶 (AD) 至关重要。本研究提出 CoT-Drive,这是一种利用大语言模型 (LLM) 和思…

[FPGA基础] RAM篇

Xilinx FPGA RAM 使用指南 1. 引言 随机存取存储器(RAM)是 Xilinx FPGA 设计中用于存储和快速访问数据的重要资源。Xilinx FPGA 提供多种 RAM 类型,包括块 RAM(Block RAM)和分布式 RAM(Distributed RAM&a…

Elasticsearch内核探秘:从Shard分配到网络通信的深度实践指南

#作者:孙德新 文章目录 一、底层模块深入解析之shard allocation1、shard allocation的介绍2、cluster level shard allocation介绍3、disk-based shard allocation介绍4、shard allocation awareness5、shard allocation filtering6、node下线时的shard延迟分配7、…

SQL Server 2022 常见问题解答:从安装到优化的全场景指南

SQL Server 2022 作为微软最新的数据库管理系统,在性能、安全性和云集成方面带来了多项革新。然而,用户在实际使用中仍可能遇到各类问题。本文将围绕安装配置、性能优化、备份恢复、安全设置、高可用性方案、兼容性问题及错误代码解析等核心场景&#xf…

57、Spring Boot 最佳实践

Spring Boot 最佳实践 一. 开发规范与代码风格 编写高质量的代码不仅需要功能的实现,还需要遵循一定的规范和代码风格,以提高代码的可读性、可维护性和协作效率。以下是 Spring Boot 开发中的一些关键规范和代码风格建议。 1. 代码命名规范 在编写代码时,命名是非常重要的…

​​OSPF核心机制精要:选路、防环与设计原理​

一、OSPF选路规则解析 OSPF作为经典的链路状态路由协议,其选路规则采用层次化优先级机制,不同路由类型遵循严格比较顺序: 1. 路由类型优先级 优先级路由类型描述1域内路由通过1类、2类LSA生成2域间路由通过3类LSA生成3域外路由通过5类/7类…

1.1软考系统架构设计师:系统架构的定义与作用 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析

超简记忆要点 定义:结构决策 | 抽象概念 | 多视图模型(逻辑/物理/动态)作用:解耦复杂需求 | 集成扩展 | 指导开发(蓝图)要素:构件(原子/复合) | 连接件(API/…

网络socks 代理

在系统/终端中设了这样的环境变量,而没有在代码中覆盖,HTTPX 就会启用该 socks 代理。 env | grep proxy https_proxyhttps://proxyhk.zte.com.cn:80 http_proxyhttp://proxyhk.zte.com.cn:80 no_proxylocalhost,127.0.0.0/8,::1,zte.com.cn,zte.intra,…

PCB规则

PCB封装 原理图绘制完成需要检查 DRC 菜单栏——>设计——>检查 DRC 底部侧边栏——>DRC——>检查 DRC 常见问题: 1)某个导线/网络标签是一个单网络 网络标签名称不一样 网络标签只有一个 引脚没有使用,但是放置了导线 2&#xf…

图像预处理-图像边缘检测(流程)

一.高斯滤波 因为图像边缘检测就是把像素值有差异的地方提取出来,所以噪声会有很大影响,因此需要对图像进行平滑处理,高斯滤波是流程中常用的方法。 二.计算图像的梯度与方向 过程中通常使用sobel算子进行梯度计算,在OpenCV中&am…

ChatBEV:一种理解 BEV 地图的可视化语言模型

25年3月来自上海交大、上海AI实验室、同济大学和MAGIC的论文“ChatBEV: A Visual Language Model that Understands BEV Maps”。 交通场景理解对于智能交通系统和自动驾驶至关重要,可确保车辆安全高效地运行。虽然 VLM 的最新进展已显示出整体场景理解的前景&…

武装Burp Suite工具:xia SQL自动化测试_插件

武装Burp Suite工具:xia SQL自动化测试_插件 插件作者介绍:本插件仅只插入单引号,没有其他盲注啥的,且返回的结果需要人工介入去判断是否存在注入,如果需要所有注入都测试,请把burp的流量转发到xray。 目录…

线段树讲解(小进阶)

目录 前言 一、线段树知识回顾 线段树区间加减 区间修改维护: 区间修改的操作: 区间修改update: 线段树的区间查询 区间查询: 区间查询的操作: 递归查询过程: 区间查询query: 代码&…

neo4j中节点内的名称显示不全解决办法(如何让label在节点上自动换行)

因为节点过多而且想让节点中所有文字都显示出来而放大节点尺寸 从neo4j中导出png,再转成PDF来查看时,要看清节点里面的文字就得放大5倍才行 在网上看了很多让里面文字换行的办法都不行 然后找到一个比较靠谱的办法是在要显示的标签内加换行符 但是我的节点上显示的是…

SQL进阶知识:五、存储过程和函数

今天介绍下关于存储过程和函数的详细介绍,并结合MySQL数据库提供实际例子。 在MySQL中,存储过程(Stored Procedures)和函数(Functions)是数据库编程的重要组成部分,它们可以封装SQL语句&#xf…

CONDA:用于 Co-Salient 目标检测的压缩深度关联学习(总结)

摘要 一 介绍 二 有关工作 三 提出的方法 图2:我们的凝聚式深度关联(CONDA)模型的整体流程图。具体来说,凝聚式深度关联(CONDA)模型首先利用图像特征来计算超关联。然后,全像素超关联由对应诱…