【Machine Learning】Generalization Theory

本笔记基于清华大学《机器学习》的课程讲义中泛化理论相关部分,基本为笔者在考试前一两天所作的Cheat Sheet。内容较多,并不详细,主要作为复习和记忆的资料。

No free lunch

  • For algroithm A ′ A' A, exsits f f f that is perfect answer of D ∈ C × { 0 , 1 } D\in C\times\{0,1\} DC×{0,1}, such that L D ( f ) = 0 L_D(f)=0 LD(f)=0 and

E S ∼ D m [ L D ( A ′ ( S ) ) ] ≥ 1 4 E_{S\sim D^m}[L_D(A'(S))]\ge \frac{1}{4} ESDm[LD(A(S))]41

  • Then Pr ⁡ [ L D ( A ′ ( S ) ) ≥ 1 8 ] ≥ 1 7 \Pr[L_D(A'(S))\ge \frac{1}{8}]\ge \frac{1}{7} Pr[LD(A(S))81]71

  • Proof:
    max ⁡ i E S ∼ D i m [ L D ( A ′ ( S ) ) ] = max ⁡ i 1 k ∑ i = 1 k L D i ( A ′ ( S i ) ) ≥ 1 T ∑ j = 1 T 1 k ∑ i = 1 k L D j ( A ′ ( S i ) ) ≥ 1 k ∑ i = 1 k 1 T ∑ j = 1 T L D j ( A ′ ( S i ) ) ≥ min ⁡ S 1 T ∑ j = 1 T L D j ( A ′ ( S ) ) ≥ min ⁡ S 1 T ∑ j = 1 T 1 2 m ∑ i = 1 p 1 A ′ wrong at  v i ≥ min ⁡ S 1 T ∑ j = 1 T 1 2 p ∑ i = 1 p 1 A ′ wrong at  v i ≥ 1 2 min ⁡ S 1 T ∑ j = 1 T min ⁡ i 1 A ′ wrong at  v i ≥ 1 4 \begin{align*} \max_{i}E_{S\sim D_i^m}[L_D(A'(S))]&=\max_{i}\frac{1}{k}\sum_{i=1}^k L_{D_i}(A'(S_i))\\ &\ge \frac{1}{T}\sum_{j=1}^T\frac{1}{k}\sum_{i=1}^k L_{D_j}(A'(S_i))\\ &\ge \frac{1}{k}\sum_{i=1}^k\frac{1}{T}\sum_{j=1}^T L_{D_j}(A'(S_i))\\ &\ge \min_S\frac{1}{T}\sum_{j=1}^T L_{D_j}(A'(S))\\ &\ge \min_S\frac{1}{T}\sum_{j=1}^T \frac{1}{2m}\sum_{i=1}^p1_{A'\text{ wrong at }v_i}\\ &\ge \min_S\frac{1}{T}\sum_{j=1}^T \frac{1}{2p}\sum_{i=1}^p1_{A'\text{ wrong at }v_i}\\ &\ge \frac{1}{2}\min_S\frac{1}{T}\sum_{j=1}^T \min_{i} 1_{A'\text{ wrong at }v_i}\\ &\ge \frac{1}{4} \end{align*} imaxESDim[LD(A(S))]=imaxk1i=1kLDi(A(Si))T1j=1Tk1i=1kLDj(A(Si))k1i=1kT1j=1TLDj(A(Si))SminT1j=1TLDj(A(S))SminT1j=1T2m1i=1p1A wrong at viSminT1j=1T2p1i=1p1A wrong at vi21SminT1j=1Timin1A wrong at vi41

    • The last inequality is beause divide T T T into 2 2 2 parts. One pair f i , f i ′ f_i,f_{i'} fi,fionly differs at v i v_i vi.

ERM

  • With realizable assumption, the hypothesis class found by ERM is good enough with at least some samples

    • Consider the probability of bad samples L S ( h S ) = L S ( h ∗ ) = 0 L_S(h_S)=L_S(h^*)=0 LS(hS)=LS(h)=0 but L D , f ( h S ) > ϵ L_{D,f}(h_S)>\epsilon LD,f(hS)>ϵ. Then we need S S S to be the union(apply union bound) of misleading set L S ( h S ) = 0 L_S(h_S)=0 LS(hS)=0, each sample has probability ≤ 1 − ϵ \le 1-\epsilon 1ϵ. Then probability is ∣ H B ∣ ( 1 − ϵ ) m |H_B|(1-\epsilon)^m HB(1ϵ)m
  • PAC learnable: As sample number m ≥ m ( ϵ , δ ) m\ge m(\epsilon,\delta) mm(ϵ,δ), w.p. 1 − δ 1-\delta 1δ we can find a h h h such that L D , f ( h ) ≤ ϵ L_{D,f}(h)\le \epsilon LD,f(h)ϵ.

    • Agnostic PAC learnable: L D ( h ) ≤ L D ( h ∗ ) + ϵ L_{D}(h)\le L_{D}(h^*)+\epsilon LD(h)LD(h)+ϵ
  • VC dimension

Rademacher

  • Generalization:
    L D ( h ) − L S ( h ) ≤ 2 E S ′ ∼ D m R ( l ∘ H ∘ S ′ ) + c 2 ln ⁡ 2 δ m L_D(h)-L_S(h)\le 2E_{S'\sim D^m}R(l\circ H\circ S')+c\sqrt{\frac{2\ln\frac{2}{\delta}}{m}} LD(h)LS(h)2ESDmR(lHS)+cm2lnδ2

  • Massart Lemma:
    R ( A ) ≤ max ⁡ a ∈ A ∣ a − a ˉ ∣ 2 log ⁡ N m R(A)\le \max_{a\in A}|a-\bar{a}|\frac{\sqrt{2\log N}}{m} R(A)aAmaxaaˉm2logN

  • Contraction Lemma: If ϕ \phi ϕ is ρ \rho ρ-lipschitz, then
    R ( ϕ ∘ A ) ≤ ρ R ( A ) R(\phi\circ A)\le \rho R(A) R(ϕA)ρR(A)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/609514.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python数据类型转换

数据类型的不一致可能导致分析错误,因此在数据清洗中通常需要对数据类型进行转换。 主要包括一下几个方面: 整数(int)和浮点数(float)之间的转换 字符串(str)和整数(in…

Python——数据类型转换

# 将数字类型转换成字符串 num_str str(111) print(type(num_str), num_str) \# 将浮点类型转换成字符串 float_str str(12.34) print(type(float_str), float_str) # 将字符串转变成数字 num int("234") print(type(num)) # 将字符串转变成浮点型 num2 float(&q…

BitMap解析(一)

文章目录 前言数据结构添加与删除操作 JDK中BitSet源码解析重要成员属性初始化添加数据清除数据获取数据size和length方法集合操作:与、或、异或 前言 为什么称为bitmap? bitmap不仅仅存储介质以及数据结构不同于hashmap,存储的key和value也…

centos 8 安装docker

一,安装依赖: yum install -y yum-utils device-mapper-persistent-data lvm2 二,安装docker仓库源: #docker官方仓库源 yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo #国内阿里仓…

4D激光雷达

什么是4D激光雷达 4D激光雷达,也称为4D成像雷达,是一种利用回声定位和飞行时间测量概念来绘制三维环境中物体并附加速度信息的技术。相比于传统的3D激光雷达,4D激光雷达可以生成点云的3D坐标,并提供关于环境的第四维度信息,通常是速度。这种技术被广泛应用于自动驾驶汽车…

微服务使用过程中 常见的问题 解决方案

随着现代软件开发和实践的发展,微服务架构已经成为许多企业和技术团队的首选架构。然而,在微服务使用过程中,也会遇到一些常见的问题。本文将论述这些问题以及相应的解决方案。 常见问题 服务间通信:在微服务架构中,服…

根据方程组解,生成n个n元一次方程组

为了生成一个方程组&#xff0c;今天搓了一个 利用增广矩阵进行操作 #include <stdio.h> #include<iostream> #include <stdlib.h> #include <time.h> #include <unistd.h> using namespace std; #define MAX_SIZE 200int var_num0;int matr…

Spring之Bean生命周期源码解析

Bean的生成过程 1. 生成BeanDefinition Spring启动的时候会进行扫描&#xff0c;会先调用 org.springframework.context.annotation.ClassPathScanningCandidateComponentProvider#scanCandidateComponents(String basePackage) 扫描某个包路径&#xff0c;并得到BeanDefini…

ML:2-2neural network layer

文章目录 1. 神经网络层2. 更复杂的神经网络3. 神经网络的前向传播 【吴恩达机器学习笔记p47-49】 1. 神经网络层 input&#xff1a;4个数字的向量。3个神经元分别做logistic regression。下角标&#xff1a;标识第 i 个神经元的值。上角标&#xff1a;表示第 j 层layer的值。…

打PTA 分数 15

传说这是集美大学的学生对话。本题要求你做一个简单的自动问答机&#xff0c;对任何一个问句&#xff0c;只要其中包含 PTA 就回答 Yes!&#xff0c;其他一概回答 No.。 输入格式&#xff1a; 输入第一行给出一个整型范围内的正整数 N&#xff0c;随后 N 行&#xff0c;每行给…

单片机原理及应用:中断系统结构与控制寄存器

大家好啊&#xff0c;这几天因为考试断更了一段时间&#xff0c;现在放假了也可以恢复正常的更新速度了。今天我们来认识一下单片机的中断系统&#xff0c;这里可以说是我们学习单片机以来第一个核心功能&#xff0c;我们会分几期内容来深入了解中断系统的作用原理和应用方式。…

系列十五、Java中常见的修饰符

一、Java中常见的修饰符 1.1、概述 Java中常见的修饰符有&#xff1a;默认、private&#xff08;私有&#xff09;、protected&#xff08;保护&#xff09;、public&#xff08;公有&#xff09;&#xff0c;访问修饰符可以修饰成员变量、方法。 1.2、详解 private &#xff…

搜索插入位置【二分查找】

Problem: 35. 搜索插入位置 文章目录 思路 & 解题方法复杂度调用函数手写 思路 & 解题方法 二分查找&#xff0c;可以手写一下&#xff0c;也可以直接用bisect。 复杂度 时间复杂度: 添加时间复杂度, 示例&#xff1a; O ( l o g n ) O(logn) O(logn) 空间复杂度: 添…

vue+springboot+mybatis-plus实现乡村公共文化服务系统

项目前端&#xff1a;https://gitee.com/anxin-personal-project/rural-public-cultural-services-front 项目后端&#xff1a;https://gitee.com/anxin-personal-project/rural-public-cultural-services-behind 1.系统简介 乡村公共服务文化提供给管理员、商家、村民。管理…

python爬虫实战(6)--获取某度热榜

1. 项目描述 需要用到的类库 pip install requests pip install beautifulsoup4 pip install pandas pip install openpyxl然后&#xff0c;我们来编写python脚本&#xff0c;并引入需要的库&#xff1a; import requests from bs4 import BeautifulSoup import pandas as p…

36-javascript输出方式,弹框:普通,confirm弹框,prompt弹框,控制台输出:普通,warm,error

1.页面打印 <body><p>你真是一个小机灵鬼</p><script>// 页面打印document.write("打印内容");</script> </body> 2.覆盖文档 <body><p>你真是一个小机灵鬼</p><script>// 覆盖文档window.onload f…

如何定位linux系统内存使用的问题?

在Ubuntu系统中&#xff0c;定位内存使用问题通常涉及查看总体内存使用情况、识别占用内存较大的进程以及深入分析特定进程的内存消耗。以下是一系列详细步骤&#xff1a; 检查整体内存使用情况&#xff1a; 使用free命令查看系统内存使用总量、已用内存和可用内存&#xff1a;…

java 面试题框架篇

java 面试题框架篇 文章目录 java 面试题框架篇**面试官**&#xff1a;Spring框架中的单例bean是线程安全的吗&#xff1f;**面试官**&#xff1a;什么是AOP**面试官**&#xff1a;你们项目中有没有使用到AOP**面试官**&#xff1a;Spring中的事务是如何实现的**面试官**&#…

用Java编写图书网站信息采集程序教程

目录 一、准备工作 二、分析目标网站结构 三、选择信息采集方式 四、安装Jsoup库 五、编写信息采集程序 六、注意事项 总结&#xff1a; 编写图书网站信息采集程序需要掌握HTML、CSS、JavaScript、Java等前端和后端技术。下面是一个简单的教程&#xff0c;介绍如何使用…

1880_安装QEMU_for_ARC

Grey 全部学习内容汇总&#xff1a; https://github.com/GreyZhang/g_ARC 主标题 想学习一点ARC相关的知识&#xff0c;但是手里没有开发板。看了下&#xff0c;使用QEMU似乎是一个很好的选择&#xff0c;正好也有这么一个分支。在此&#xff0c;记录一下环境搭建的过程。 …