[PyTorch][chapter 5][李宏毅深度学习][Classification]

前言:

        这章节主要讲解常用的分类器原理.分类主要是要找到一个映射函数

         c=f(x) 比如垃圾邮件分类 :

         c=0, 垃圾邮件  c=1 正常邮件

      主要应用场景: 垃圾邮件分类,手写数字识别,金融信用评估.

       这里面简单了解一下,很少用

目录:

    1: Generative model

    2:    高斯分类器

    3:    高斯分类器跟其它模型关系


一 Generative model

     朴素贝叶斯分类器:

     以二分类为例:

       c_1,c_2  不同类别

       p(c_1),p(c_2): 不同类别出现的概率,先验概率

      p(x|c_1),p(x|c_2): 条件概率,不同类别中出现x的概率

  模型

          p(c_1 |x)=\frac{p(x)p(x|c_1)}{p(x|c_1)p(c_1)+p(x|c_2)p(c_2)}(贝叶斯联合分布推导)

    例子:

    有两个盒子,里面分别放绿球和红球

       

现在有个绿色的球,它来自哪个盒子

    p(c_1|g)=\frac{p(g|c_1)p(c_1)}{p(g)}

   其中p(g)=p(c_1)p(g|c_1)+p(c_2)p(g|c_2)

                 =\frac{2}{3}\frac{4}{5}+\frac{1}{3}\frac{2}{5}

     所以

      p(c_1|g)=\frac{4}{5}

      p(c_c|g)=1-\frac{4}{5}=\frac{1}{5}


二  高斯分类器

     2.1  模型

        假设不同类别服从不同的高斯分布

        输入x ,输出 对该类别的概率

       

       u : 均值

        \sum: 协方差矩阵  

     

a = np.cov(x,y)

   2.2  主要流程

             

       2.3 maximum likelihood 极大似然估计(计算u,\sum

                高斯分类器第一步要得到均值,和方差。均值,方差如何获取?

                我们通过极大似然估计 计算均值 和 协方差矩阵

               我们有训练样本 (x^1,c_1),(x^2,c_1),(x^3,c_1).....(x^N,c_1)

                我们要找到u,\sum使得下面概率最大

                 L(u,\sum)=f_{u,\sum}(x^1)=f_{u,\sum}(x^2)...f_{u,\sum}(x^N)

                 这个值就是样本均值和样本的协方差,假设有79个点

              

            2.3 高斯分类器问题   

           不同均值,方差的高斯分类器容易发生过拟合.

           为了降低过拟合,通常假设不同类别的方差一样,均值不同. 通过增加样本数降低方差 。如下图两类样本.

L(u_1,u_2,\sum)=f_{u_1,\sum}(x^1)f_{u_1,\sum}(x^2)...f_{u_2,\sum}(x^{80})...f_{u_2,\sum}(x^{179})


三  高斯分类器跟其它模型关系

1: 跟Sigmoid 关系

     设   z=ln \frac{p(x|c_1)p(c_1)}{p(x|c_2)p(c_2)}

     则

     p(c_1|x)=\frac{p(x|c_1)p(c_1)}{p(x|c_1)p(c_1)+p(x|c_2)p(c_2)}

                   =\frac{1}{1+\frac{p(x|c_2)p(c_2)}{p(x|c_1)p(c_1)}}

                   =\frac{1}{1+e^{-z}}

                   =\sigma (z)

 3.2  跟Linear 函数的关系

           z=ln\frac{p(x|c_1)}{p(x|c_2)}+ln\frac{p(c_1)}{p(c_2)}

                 =ln\frac{p(x|c_1)}{p(x|c_2)}+ln\frac{N_1}{N_2}

  当 \sum^2=\sum^1=\sum 时候,可以进一步简化

 z=(u_1-u_2)^T(\sum)^{-}x-\frac{1}{2}u_1^T\sum^{-}u_1+\frac{1}{2}u_2^T\sum^{-}u_2+ln\frac{N_1}{N_2}  

非x 的项可以看作常数b

x项前面可以看作w

 z=wx+b

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204046.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

离线数仓构建案例一

数据采集 日志数据(文件)到Kafka 自己写个程序模拟一些用户的行为数据,这些数据存在一个文件夹中。 接着使用flume监控采集这些文件,然后发送给kafka中待消费。 1、flume采集配置文件 监控文件将数据发给kafka的flume配置文件…

STM32——定时器Timer

定时器工作原理 软件定时 缺点:不精确、占用 CPU 资源 void Delay500ms() //11.0592MHz {unsigned char i, j, k;_nop_();i 4;j 129;k 119;do{do{while (--k);} while (--j);} while (--i); } 使用精准的时基,通过硬件的方式,实现定时功…

Linux---访问NFS存储及自动挂载

本章主要介绍NFS客户端的使用 创建NFS服务器并通过NFS共享一个目录在客户端上访问NFS共享的目录自动挂载的配置和使用 访问NFS存储 前面介绍了本地存储,本章就来介绍如何使用网络上的存储设备。NFS即网络文件系统, 所实现的是 Linux 和 Linux 之间的共…

易点易动:颠覆固定资产用量管理,实现高效精准的企业固定资产管理

固定资产用量管理是企业日常运营中不可或缺的一环。然而,传统的人工管理方式面临着时间成本高、数据不准确、难以监控等问题。为了解决这些挑战,易点易动应运而生,它是一款先进的资产管理系统,能够帮助企业实现高效精准的固定资产…

案例054:基于微信的追星小程序

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

linux的权限741

741权限 在 Linux 中,文件和目录的权限由三组权限来定义,分别是所有者(Owner)、所属组(Group)和其他用户(Others)。每一组权限又分为读(Read)、写&#xff0…

c++函数模板STL详解

函数模板 函数模板语法 所谓函数模板,实际上是建立一个通用函数,其函数类型和形参类型不具体指定,用一个虚拟的类型来代表。这个通用函数就称为函数模板。 凡是函数体相同的函数都可以用这个模板来代替,不必定义多个函数&#xf…

Java安全之Commons Collections5

CC5分析 import org.apache.commons.collections.Transformer; import org.apache.commons.collections.functors.ChainedTransformer; import org.apache.commons.collections.functors.ConstantTransformer; import org.apache.commons.collections.functors.InvokerTransfo…

基于ssm绿色农产品推广应用网站论文

摘 要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存…

Cloudways和SiteGround哪个更好?

当提及WordPress托管服务提供商时,人们常常会拿Cloudways和SiteGround做比较。Cloudways作为备受欢迎的品牌,而SiteGround则是业界的老牌巨头。它们之间主要的区别在于服务范围。SiteGround提供广泛的托管服务,包括Web托管、WordPress托管、W…

『VUE3后台—硅谷甄选』

一、准备前期 pnpm create vite

【【RGB LCD 彩条显示实验 ---1】】

RGB LCD 彩条显示实验 —1 TFT-LCD 的全称是 Thin Film Transistor-Liquid Crystal Display,即薄膜晶体管液晶显示屏,它显示的每个像素点都是由集成在液晶后面的薄膜晶体管独立驱动,因此 TFT-LCD 具有较高的响应速度以及较好的图像质量。 我…

一对一单聊

服务端 package 一对一用户;import java.awt.BorderLayout; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.net.ServerSocket; import java.net.Socket; import java.util.Vector;…

19、XSS——HTTP协议安全

文章目录 一、Weak Session IDs(弱会话IDs)二、HTTP协议存在的安全问题三、HTTPS协议3.1 HTTP和HTTPS的区别3.2 SSL协议组成 一、Weak Session IDs(弱会话IDs) 当用户登录后,在服务器就会创建一个会话(Session),叫做会话控制&…

【JavaScript手撕代码】flat、push、filter、map、repeat

flat 借助上面递归concat扁平化即可 Array.prototype.myflat function(deep1) {let res []deep--for(const element of this) {if(Array.isArray(element) && deep) {res res.concat(element.myflat(deep))}else{res.push(element)}}return res }push 根据我们对…

urllib爬虫 应用实例(三)

目录 一、 ajax的get请求豆瓣电影第一页 二、ajax的get请求豆瓣电影前十页 三、ajax的post请求肯德基官网 一、 ajax的get请求豆瓣电影第一页 目标:获取豆瓣电影第一页的数据,并保存为json文件 设置url,检查 --> 网络 --> 全部 -…

zedbox 实现配置 yolov5

Stereolabs 的 ZED Box 是一款由 NVIDIA Jetson™ 提供支持的紧凑型网关,用于在移动和现场情况下挑战 AIoT(物联网)。它旨在将空间感知和理解带到边缘,并聚合、处理和分析来自 3D 传感器和设备的数据。 相关内容 1.win10下 cud…

下载加速器steam++

解决auto-py-to-exe打包文件时无法访问浏览器界面的问题。 下载地址:瓦特工具箱(Steam官网) - Watt Toolkit (steampp.net) 进入gitee后需要注册账号 3.0.0-rc.3 RMBGAME/SteamTools - Gitee.com 下载后安装即可 打开安装好的文件 成功打开

跨境电商危机公关:应对负面舆情的策略优化

随着跨境电商的快速发展,企业在全球市场中面临的竞争与挑战也日益复杂。在这个数字时代,负面舆情一旦爆发,可能对企业形象和经营造成深远影响。 因此,跨境电商企业需要建立有效的危机公关策略,以迅速、果断、有效地应…

R语言手册30分钟上手

文章目录 1. 环境&安装1.1. rstudio保存工作空间 2. 创建数据集2.1. 数据集概念2.2. 向量、矩阵2.3. 数据框2.3.1. 创建数据框2.3.2. 创建新变量2.3.3. 变量的重编码2.3.4. 列重命名2.3.5. 缺失值2.3.6. 日期值2.3.7. 数据框排序2.3.8. 数据框合并(合并沪深300和中证500收盘…