朋友叫我去柬埔寨做彩票网站推广/如何在百度上发布自己的广告

朋友叫我去柬埔寨做彩票网站推广,如何在百度上发布自己的广告,网站开发工程师岗位职责,电商运营 网站运营论文地址:https://arxiv.org/pdf/2403.07705 源码地址:https://github.com/jiaw-z/DKT-Stereo 概述 通过在合成数据上预训练的模型在未见领域上表现出强大的鲁棒性。然而,在现实世界场景中对这些模型进行微调时,其领域泛化能力可…

论文地址:https://arxiv.org/pdf/2403.07705
源码地址:https://github.com/jiaw-z/DKT-Stereo


概述

通过在合成数据上预训练的模型在未见领域上表现出强大的鲁棒性。然而,在现实世界场景中对这些模型进行微调时,其领域泛化能力可能会严重下降。本文探讨了在不损害模型对未见领域泛化能力的前提下,如何微调立体匹配网络。研究动机来源于比较真实标签(GT)与伪标签(PL)在微调过程中的差异:GT会退化,但PL能够保持领域泛化能力。通过实验发现,GT与PL之间的差异包含了有价值的信息,这些信息可以在微调过程中对网络进行正则化。文章还提出了一种框架,该框架包括一个冻结的教师网络、一个指数移动平均(EMA)教师网络和一个学生网络。核心思想是利用EMA教师网络来衡量学生网络学到的内容,并动态改进GT和PL以进行微调。作者将该框架与最先进的网络集成,并在多个真实世界数据集上评估了其有效性。本文的贡献如下:

  • 首次尝试解决微调立体匹配网络时领域泛化能力下降的问题。我们基于真实标注和伪标注之间的差异将像素分为一致和不一致区域,并展示了它们在微调期间的不同作用。我们进一步分析了它们的作用,确定了导致领域泛化能力下降的两个主要原因:在没有足够正则化的情况下学习新知识和过度拟合真实标注细节。
  • 提出了F&E模块来解决这两个原因,过滤掉不一致区域以避免正则化不足,并在一致区域集成视差以防止过度拟合真实标注细节。
  • 引入了通过结合指数移动平均教师来动态调整不同区域的方法,实现了在保留领域泛化能力和学习目标域知识之间的平衡。
  • 开发了DKT微调框架,可以轻松应用于现有网络,显著提高了它们对未见领域的鲁棒性,并同时实现了有竞争力的目标域性能。

方法

在这里插入图片描述

定义

文中将像素划分为三类区域:
一致区域 X c ( τ ) X_c(\tau) Xc(τ):伪标签 D ^ ( x i ) \hat{D}(x_i) D^(xi)与真实标签 D ( x i ) D^(x_i) D(xi)差异小于阈值 τ \tau τ的区域
X c ( τ ) = x ∣ ∣ D ^ ( x i ) − D ( x i ) ∣ < τ X_c(\tau) = {x \mid |\hat{D}(x_i) - D^(x_i)| < \tau} Xc(τ)=xD^(xi)D(xi)<τ
该区域代表GT与PL高度对齐。
不一致区域 X i n c ( τ ) X_{inc}(\tau) Xinc(τ):GT与PL差异大于等于 τ \tau τ的区域
X i n c ( τ ) = x ∣ ∣ D ^ ( x i ) − D ∗ ( x i ) ∣ ≥ τ X_{inc}(\tau) = {x \mid |\hat{D}(x_i) - D^*(x_i)| \geq \tau} Xinc(τ)=xD^(xi)D(xi)τ
网络在该区域可能遇到预训练未见的新挑战。
无效区域 X i n v a l i d X_{invalid} Xinvalid:因GT稀疏性导致无标注的区域

关键发现

GT微调的问题

  • 不一致区域:网络学习新知识但缺乏正则化,导致域泛化能力下降。
  • 一致区域:网络可能过拟合GT的细节。

PL的优势

  • 一致区域:使用 X c ( 3 ) X_c(3) Xc(3)的PL微调可保留域泛化能力。
  • 无效区域:PL在无标注区域的预测能提升泛化能力。

联合训练:直接联合GT和PL效果不佳,但通过Filter and Ensemble (F&E)模块动态优化标签后,可平衡目标域性能和模型原有泛化能力。

DKT Framework

冻结教师:

  生成初始伪标签,微调过程中参数冻结,保留预训练模型的原始知识。

EMA教师:

  通过学生网络权重动态更新
θ T ′ = m ⋅ θ T ′ + ( 1 − m ) ⋅ θ S ( m ∈ [ 0 , 1 ] ) \theta_{T'} = m \cdot \theta_{T'} + (1-m) \cdot \theta_S \quad (m \in [0,1]) θT=mθT+(1m)θS(m[0,1])
EMA教师模型可以量化Student已掌握的知识,作为区域划分依据来衡量一致/不一致区域。

学生模型:

  使用改进后的GT和PL进行训练,最终用于推理,通过动态调整学习区域防止过拟合。

F&E模块:

F&E-GT(处理真实标注)
  区域划分:基于阈值τ(默认τ=3)将GT划分为:
    1)不一致区域( X i n c X_{inc} Xinc):|GT - EMA预测| ≥ τ。
    2)一致区域( X c X_c Xc):|GT - EMA预测| < τ
  动态处理机制:
     1) X i n c X_{inc} Xinc区域:以概率 p = 1 − ∣ X i n c ∣ ∣ X v a l i d ∣ p=1-\frac{|X_{inc}|}{|X_{valid}|} p=1XvalidXinc随机保留,减少高难度区域对学习过程的干扰。
     2) X c X_c Xc区域:通过随机权重α对GT和EMA预测进行线性插值:
D ˉ c ∗ = α ⋅ D ∗ + ( 1 − α ) ⋅ D ^ T ′ ( α ∼ U ( 0 , 1 ) ) \bar{D}^*_c = \alpha \cdot D^* + (1-\alpha) \cdot \hat{D}^{T'} \quad (\alpha \sim U(0,1)) Dˉc=αD+(1α)D^T(αU(0,1))
此外,将其限制输出与GT的偏差在±1像素内,且添加细粒度扰动防止细节过拟合。

F&E-PL(处理伪标签)

  区域筛选:通过掩码 M ^ = ∣ D ^ T − D ^ T ′ ∣ < τ \hat{M} = \vert \hat{D}^{T} - \hat{D}^{T'} \vert < \tau M^=D^TD^T<τ 过滤不一致区域。

  精度提升机制:在一致区域使用随机权重β集成两个Teacher的预测,渐进式提升PL质量:
D T = β ⋅ D ^ T + ( 1 − β ) ⋅ D ^ T ′ ( β ∼ U ( 0 , 1 ) ) D_T = \beta \cdot \hat{D}T + (1-\beta) \cdot \hat{D}{T'} \quad (\beta \sim U(0,1)) DT=βD^T+(1β)D^T(βU(0,1))

训练策略
最终损失函数结合改进后的GT和PL监督:
L = L d i s p ( D ^ , D ˉ ∗ , M ∗ ) + λ L d i s p ( D ^ , D ˉ T , M ^ ) L = L_{disp}(\hat{D}, \bar{D}^* ,M^*) + \lambda L_{disp}(\hat{D}, \bar{D}^T, \hat{M}) L=Ldisp(D^,Dˉ,M)+λLdisp(D^,DˉT,M^)
EMA重置机制:每5k步将EMA Teacher权重重置为当前Student, 使区域划分随学习进度动态更新。


实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/73629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯第10届 后缀表达式

题目描述 给定 N 个加号、M 个减号以及 NM1 个整数 A1,A2,⋅⋅⋅,ANM1​&#xff0c;小明想知道在所有由这N 个加号、M 个减号以及 NM1 个整数凑出的合法的 后缀表达式中&#xff0c;结果最大的是哪一个&#xff1f; 请你输出这个最大的结果。 例如使用 1 2 3 -&#xff0c…

C++前缀和

个人主页&#xff1a;[PingdiGuo_guo] 收录专栏&#xff1a;[C干货专栏] 大家好&#xff0c;今天我们来了解一下C的一个重要概念&#xff1a;前缀和 目录 1.什么是前缀和 2.前缀和的用法 1.前缀和的定义 2.预处理前缀和数组 3.查询区间和 4.数组中某个区间的和是否为特定…

uni app跨端开发遇到的问题

技术栈 uni app&#xff0c;vue3&#xff0c;uview puls&#xff0c;map… nvue 因为项目中有地图&#xff0c;要使用到map标签&#xff0c;所以考虑用原生nvue开发&#xff0c;它是有痛点的&#xff0c;首先浏览器不支持&#xff0c;我是要开发ios和Android&#xff0c;所以…

element-ui messageBox 组件源码分享

messageBox 弹框组件源码分享&#xff0c;主要从以下两个方面&#xff1a; 1、messageBox 组件页面结构。 2、messageBox 组件属性。 一、组件页面结构。 二、组件属性。 2.1 title 标题&#xff0c;类型为 string&#xff0c;无默认值。 2.2 message 消息正文内容&#xf…

支付页面安全与E-Skimming防护----浅谈PCI DSS v4.0.1要求6.4.3与11.6.1的实施

关键词&#xff1a;支付页面安全、E-Skimming、PCI DSS v4.0.1、第三方脚本、风险管理、持卡人数据、数据安全、第三方服务提供商、TPSP、内容安全、网页监控、恶意脚本攻击 本文为atsec和作者技术共享类文章&#xff0c;旨在共同探讨信息安全的相关话题。转载请注明&#xff…

【gradio】从零搭建知识库问答系统-Gradio+Ollama+Qwen2.5实现全流程

从零搭建大模型问答系统-GradioOllamaQwen2.5实现全流程&#xff08;一&#xff09; 前言一、界面设计&#xff08;计划&#xff09;二、模块设计1.登录模块2.注册模块3. 主界面模块4. 历史记录模块 三、相应的接口&#xff08;前后端交互&#xff09;四、实现前端界面的设计co…

案例分享|树莓派媒体播放器,重构商场广告的“黄金三秒”

研究显示&#xff0c;与传统户外广告相比&#xff0c;数字户外广告在消费者心中的记忆率提高了17%&#xff0c;而动态户外广告更是能提升16%的销售业绩&#xff0c;整体广告效率提升了17%。这一显著优势&#xff0c;使得越来越多资源和技术流入数字广告行业。 户外裸眼3D广告 无…

23种设计模式-装饰器(Decorator)设计模式

装饰器设计模式 &#x1f6a9;什么是装饰器设计模式&#xff1f;&#x1f6a9;装饰器设计模式的特点&#x1f6a9;装饰器设计模式的结构&#x1f6a9;装饰器设计模式的优缺点&#x1f6a9;装饰器设计模式的Java实现&#x1f6a9;代码总结&#x1f6a9;总结 &#x1f6a9;什么是…

ubuntu22.04安装搜狗输入法保姆教程~

一、添加中文语言支持 1.首先打开设置,找到Language and Region 2.点击Manage Installed Languages 3.点击 Install/Remove Languages... 4.选中Chinese (simplified),点击Apply

强化学习和智能决策:Q-Learning和Deep Q-Learning算法

强化学习(Reinforcement Learning, RL)是机器学习的一个重要分支,它通过智能体(Agent)与环境交互来学习最优决策策略,旨在最大化智能体的长期累积奖励。Q-Learning和Deep Q-Learning是强化学习中的两种关键算法,它们在智能决策领域发挥着重要作用。 一、强化学习基础 …

ubuntu22.04 安装Jitsi meet 开源会议系统,代替腾讯会议

0.安装 官方安装教程Self-Hosting Guide - Debian/Ubuntu server | Jitsi Meet 一定要用域名访问&#xff0c; 一定要用域名访问&#xff0c; 一定要用域名访问&#xff0c; 一定要用域名访问&#xff0c; 域名一定要有ssl证书&#xff0c;域名一定要有ssl证书&#xff0c;域名…

专家管理系统(源码+文档+讲解+演示)

引言 在知识经济时代&#xff0c;专家管理系统成为了企业优化知识资源、提升决策效率的重要工具。本文将介绍一款创新的专家管理系统&#xff0c;该系统通过智能化工具&#xff0c;助力企业实现专家资源的高效管理和利用。 平台概述 专家管理系统采用前后端分离的架构设计&a…

关于cmd中出现无法识别某某指令的问题

今天来解决以下这个比较常见的问题&#xff0c;安装各种软件都可能会发生&#xff0c;一般是安装时没勾选注册环境变量&#xff0c;导致cmd无法识别该指令。例如mysql&#xff0c;git等&#xff0c;一般初学者可能不太清楚。 解决这类问题最主要的是了解环境变量的概念&#x…

【C++初阶】---类和对象(上)

1.类的定义 1.1类的定义格式 • class为定义类的关键字&#xff0c;Data为类的名字&#xff0c;{}中为类的主体&#xff0c;注意类定义结束时后⾯分号不能省略。类体中内容称为类的成员&#xff1a;类中的变量称为类的属性或成员变量;类中的函数称为类的⽅法或者成员函数。 •…

Rust安装并配置配置vscode编译器

一. 下载rustup-init.exe rust下载网址&#xff1a;Getting started - Rust Programming Language 根据系统&#xff0c;选择适合的exe文件 我选择的的是右边64bit的 打开下载的文件 输入1&#xff0c;回车 二. Visual C 安装 自动下载安装vs 等待安装完毕 三. Rust 安装…

ECharts各类炫酷图表/3D柱形图

一、前言 最近鸡米花实现了各类的炫酷的图表&#xff0c;有3D柱形图、双边柱形图以及异形柱形图&#xff0c;好了&#xff0c;直接上图&#xff1a; 二、效果图 一个个来吧&#xff0c;下面就是代码啦&#xff0c;注意&#xff0c;一下图表展示的宽高均为800px*300px 三、异形横…

HCIP——园区网、VLAN

园区网 园区网搭建核心思路&#xff1a;冗余&#xff08;备份&#xff09;--- 保证其健壮性 1、设备冗余 2、线路冗余 3、网关冗余 4、ups&#xff08;不间断电源&#xff09;冗余—— 能不断电&#xff08;物理层&#xff09; 三层交换机和路由器的选择&#xff1a; 三层交换…

虚拟机(二):Android 篇

虚拟机&#xff08;一&#xff09;&#xff1a;Java 篇 虚拟机&#xff08;二&#xff09;&#xff1a;Android 篇 Dalvik和JVM区别 Dalvik 基于寄存器&#xff0c;而 JVM 基于栈。 基于栈的架构具有更好的可移植性&#xff0c;因为其实现不依赖于物理寄存器基于栈的架构通常指…

Vue Kubernetes项目 局部布局 下拉菜单

下拉菜单 [el-dropdown] 下拉菜单也比较简单&#xff0c;就是类似于按钮下面来一个下拉菜单。 示例Demo如下&#xff1a; <template><el-dropdown><span class"el-dropdown-link">下拉菜单<i class"el-icon-arrow-down el-icon--right&q…

Android之卡片式滑动

文章目录 前言一、效果图二、实现步骤1.主界面xml2.自定义的viewpage3.卡片接口类4.阴影和缩放变化类5.卡片adapter6.卡片adapter的xml7.style8.CardItem9.activity实现10.指示器drawable 总结 前言 对于这个需求&#xff0c;之前的项目也有做过&#xff0c;但是过于赶项目就没…