机器学习之回归总结

  • 目录
  • 1、了解线性回归
  • 2、了解似然函数
  • 3、了解交叉验证的原理
  • 4、梯度下降算法
    • 4.1、批量梯度下降算法(Batch Gradient Descent,简称BGD):
    • 4.2、随机梯度下降算法(SGD):
    • 4.3、折中:
  • 5、了解一些参数指标
  • 6、了解Logistic回归
  • 7、了解最小二乘法
  • 8、了解AUC指标

目录

1、了解线性回归

当只有一个变量的时候,可以表示为下面的式子。
这里写图片描述
当为多个特征时,线性回归可以表示为下面的式子,掌握下面这个式子:
假定样本是独立则能得到对应的下式;这里X0是1,则能得到H(x)(可以看成是矩阵的形式)
这里写图片描述
上面的H(x)再加上一个误差就能得到符合实际的表达式即下图中的y。
了解这个y的表达式(线性回归在实际条件下的表达式)
正态分布:正常状态分布(可以这样理解)
注意后面有一个误差;误差满足独立同分布的条件;且假定误差的均值是0,方差为σ2(服从正态分布嘛)。
这里写图片描述

2、了解似然函数

统计学中,似然函数是一种关于统计模型参数的函数给定输出x时,关于参数θ的似然函数L(θ|x)(在数值上)等于给定参数θ后变量X的概率:L(θ|x)=P(X=x|θ)。所以对应的也就是求似然函数的最大值。
知道求似然函数的最大值的过程:
这里写图片描述
求对数函数的最大值转变为求J函数的最小值(Hθ函数是线性回归的表达式)
这里写图片描述
再转化为求驻点:似然函数最大值的求解过程->求J函数的驻点时利用梯度来逼近的(其间将关系表达式转化为矩阵表达式)。
注意目标函数:数学含义就是求各个点到面的距离的最小累加值。
这里写图片描述
最终转化为求参数的解析式,而初始的意愿就是要求θ的值(θ就是多特征情况下对应的特征方程的参数,知道这个参数后就能得到对应的x和y的映射关系!θ就如y=ax+b中的a和b一样)。
对应的θ并不是一下子就算出来的,而是通过梯度下降算法,不断的迭代得到的。
增加λ的意义是为了防止过拟合(相当于噪音)
这里写图片描述
这里写图片描述

知道这个惩罚因子以及它的原理
L1称为Lasso:即惩罚因子项为|θ|。L1正则可以产生稀疏模型进而用于特征选择。
L2称为Ridge(岭回归 ):即惩罚因子为θ2。L2不具有稀疏性。
惩罚因子即代表目标函数的第二项,这里当θ比较大的时候,就造成整个J函数的值比较大(我们求的是J函数的最小值),所以这里就可以认为当θ比较大的时候,直接被抑制住(即惩罚,理解为θ是有范围即下图所示的圆形和正方形)。
这里写图片描述
这里写图片描述

这里写图片描述

3、了解交叉验证的原理

k-折交叉验证(k-fold crossValidation):
在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用数据集对算法效果进行测试,将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。(五折就相当于将数据分成5份,随机选1份用于测试其他4份用于训练生成一个分类率,循环进行5次得到5个分类率,求其平均值即可)
步骤:

  1. 将全部训练集 S分成 k个不相交的子集,假设 S中的训练样例个数为 m,那么每一个子 集有 m/k 个训练样例,,相应的子集称作{s1,s2,…,sk}。
  2. 每次从分好的子集中里面,拿出一个作为测试集,其它k-1个作为训练集
  3. 根据训练训练出模型或者假设函数。
  4. 把这个模型放到测试集上,得到分类率。
  5. 计算k次求得的分类率的平均值,作为该模型或者假设函数的真实分类率。

这个方法充分利用了所有样本。但计算比较繁琐,需要训练k次,测试k次。
五折、十折代表的是将数据分成五份、十份,其中多少份用于训练数据1份用于验证数据。
这里写图片描述

4、梯度下降算法

掌握梯度下降算法,还要知道梯度下降求得是局部最优解。
这里写图片描述
目标函数求导
这里写图片描述
上式少一个α值。

梯度下降的三种算法:
对于线性回归这个模型来说采用梯度下降算法得到的局部最优解一定是全局最优解。

4.1、批量梯度下降算法(Batch Gradient Descent,简称BGD)

在更新每一参数时都使用所有的样本来进行更新,也就是方程(1)中的m表示样本的所有个数,之后通过初始的θ(需要给定的值)和学习率来不断的迭代得到最终的θ值。
优点:全局最优解;易于并行实现;
缺点:当样本数目很多时,训练过程会很慢。
这里写图片描述
这里写图片描述

4.2、随机梯度下降算法(SGD):

拿到一个数据就执行梯度下降(拿到一个数据就相当于得到一个关于θ的J函数,进而就能求对应的导数得到对应的θ值),这样造成的结果是可以躲避局部极值,如下图所示(跳出局部最优的原因是因为噪音影响PS:所以可以说噪音也未必是坏事)。
优点:训练速度快;
缺点:准确度下降,并不是全局最优;不易于并行实现。
这里写图片描述

4.3、折中:

它的具体思路是在更新每一参数时都使用一部分样本来进行更新,也就是方程中的m的值大于1小于所有样本的数量,然后再执行梯度下降算法。
这里写图片描述

5、了解一些参数指标

了解下面的TSS、RSS(SSE)、R平方、ESS(SSR)的概念。
这里写图片描述

6、了解Logistic回归

分类问题的首选算法
二分类:Logistic回归
多分类:Softmax回归
Softmax回归知道即可,在Sklearn库中,当分类数大于2时,默认的也就是Softmax回归,所以没必要再造一个函数。
这里写图片描述
这里写图片描述

对于简单的线性方程,我们可以得到最终的解析式来求的答案,但是对于复杂的线性方程,我们没有办法获得解析式,只能采用梯度下降的方法来不断的逼近结果如下图所示。
这里写图片描述
这里写图片描述
这里写图片描述

7、了解最小二乘法

最小二乘法:它的主要思想就是选择未知参数,使得理论值与观测值之差的平方和达到最小。
假设一对关系是某线性关系,且实际测量数据与该理想关系的偏差是高斯分布。
那么一个n个测量值的集合,取n-1个拟合成线性关系,用该关系预测另一个,最小二乘法可以保证:预测值和真实值的差的绝对值的期望最小。
最小二乘法与最大似然估计的解释:
最小二乘法的核心就是权衡,因为你要在很多条的直线中间选择,找出距离所有点的距离的平方和最小的那条直线。
极大似然估计核心就是自恋:对应似然函数理解就是给定参数θ我能得到对应的x发生的概率。就是去倒推这个过程(参考下图中例子理解)。
最大似然估计,就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值(似然函数的前半句内容:给定输出X计算关于θ的似然函数值)。(1即似然函数的含义:给定输出X计算关于θ的似然函数值就等于给定θ值在X事件发生的概率)
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

8、了解AUC指标

了解AUC(Area Under Curve)的含义,并且知道ROC(Receiver Operating Characterstic):受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在两种不同的判定标准下所得的结果而已。
使用AUC(即曲线下方的面积)来度量分类器的好坏,给定的阈值不同,造成TP\FP的值的不同,也就造成TPR/FPR值的不同,最终造成AUC的值的不同,分类器的效果也就不同,往往将equal error rate点作为阈值的划分依据。
这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/456468.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

html中的url、href、src的区别

url不是属性,src和href是属性,src用于替换当前元素,href用于在当前文档和引用资源之间确立联系,也就是说src引用的路径是img自己的路径,href引用的路径是要跳转到的地方。 URL:Uniform Resource Locators&…

SSIS 包部署错误 0xC0010014

SSIS 包部署错误 0xC0010014 Reinhard 在部署 SSIS 包时,提示如下错误。 由于错误 0xC0010014“发生了一个或多个错误。在此消息之前应有更为具体的错误消息,对这些错误进行详细说明。此消息用作遇到错误的函数的返回值。”,无法加载包。当 C…

Android性能优化-App后台优化

原文链接 Background Optimizations 前言 后台进程是内存和电池敏感的。一个隐式的broadcast可能会启动很多监听它的后台进程,即使这些进程可能做得工作不多。这可能丢设备性能和用户体验都有比较大的影响。 为了缓解这种问题,7.0(API 24&…

机器学习之决策树与随机森林

目录1、了解熵、条件熵、互信息的概念及公式1.1、熵1.2、条件熵1.3、信息增益/互信息 2、了解决策树2.1、了解决策树的概念和特点以及和熵的关系2.2、了解树生成的过程2.3、了解决策树三种算法的区别2.4、了解决策树的损失函数2.5、了解解决决策树过拟合的方法2.6、了解后剪枝的…

JSON(JavaScript Object Notation) 格式

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。JSON采用完全独立于程序语言的文本格式,但是也使用了类C语言的习惯。 json是 JavaScript Object Notation 的首字母缩写&…

synchronized 的理解

第一种:package com.ucmed.zsyy.util;/*** Created by ucmed on 2017/2/8.*/public class DirtyRead {private String username "zjkj";private String password "123";public synchronized void setValue(String username, String password)…

机器学习之提升算法

1、知道提升、梯度提升是什么意思1.1、提升1.2、梯度提升1.3、了解提升算法的过程 2、残差与残差平方和(residual sum of squares)3、了解GBDT算法4、了解XGBoost算法5、了解Adaboost算法5.1、Adaboost算法的原理5.2、例子 6、偏差和方差 1、知道提升、梯…

Jsoup遍历ul li下的链接信息实例

2019独角兽企业重金招聘Python工程师标准>>> Document doc;try {String URL "www.baidu.com";doc Jsoup.connect(URL).get();Elements ElementsUl doc.getElementsByTag("ul");for (Element elementLi : ElementsUl) {Elements provinceEl …

两篇波兰地区重金属污染地区土壤微生物多样性的研究

环境微生物(包括方兴未艾的肠道微生物)在不同的系统中发挥着的生态作用逐渐被意识到,我们对环境微生物实际上仍旧知之甚少,其多样性问题仍旧是一个非常基础和重要的课题。这次读的两篇文章都是关于波兰地区重金属污染地区的土壤微…

jquery中的 $(function(){})

$(function(){})的区别:$(function(){}) 是 $(document).ready(function(){}) 的简写,用来在DOM加载完成之后执行一系列预先定义好的函数。 需要注意与(function(){})相比,(function(){})表示一个匿名函数。function(arg){...}定义了一个参数…

机器学习之支持向量机(SVM)总结

文章目录1、知道SVM相关的各种概念2、知道目标函数、损失函数、正则项的意义2.1、目标函数2.2、损失函数2.3、正则化(添加噪音避免过拟合)3、了解SVM算法原理4、知道SVM的目标函数5、知道SVM的损失函数以及公式6、知道SVM支持向量机的计算过程6.1、推导过…

在CentOS上搭建PHP服务器环境

您也可以使用一键自动部署环境的工具,请参见网友开发的这个工具 http://www.centos.bz/2013/08/ezhttp-tutorial/安装apache:yum install httpd httpd-devel 启动apache:/etc/init.d/httpd start此时输入服务器的IP地址,应该看到apache的服务页面&#x…

jQuery之滚动事件$(window).scroll(function()

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>滚动事件</title><script src"https://code.jquery.com/jquery-2.2.4.min.js"></script><style>img{position:fixe…

《疯狂Java讲义》(二十九)---- JDBC

JDBC编程步骤加载数据库驱动Class.forName(driverClass). 例如&#xff1a;Class.forName("oracle.jdbc.driver.OracleDriver"); 2. 通过DriverManager获取数据库连接。 DriverManager.getConnection(String url, String user, String pwd); 3. 通过Connection对象创…

机器学习之聚类算法的原理推导及相关知识总结

文章目录1、知道几个关于"差"的概念2、理解相似度度量的各种方法和相互关系2.1、欧氏距离2.2、jaccard相似系数2.3、余弦相似度2.4、Pearson相似系数2.5、相对熵3、掌握掌握K-Means算法3.1、知道聚类的思想3.2、K-Means算法原理3.3、知道K-Mediods聚类3.4、如何选取K…

Flex 布局教程:语法

Java数组声明的三种方式 第一种(声明并初始化)&#xff1a; 数据类型[] 数组名{值,值,...}; 例&#xff1a;int[] a {1,2,3,4,5,6,7,8}; 第二种(声明后赋值)&#xff1a; 数据类型[] 数组名 new 数据类型[数组长度]; 数组名[下标1]值…

注意:匿名函数调用直接加载函数名setInterval(move,30)

setInterval要求第一个参数必须是含Javascript命令的字符串或函数对象&#xff0c;所以 setInterval("move()",300) 以及 setInterval(move,300) 这两个都是正确的。 而 setInterval(move(),300) 当Javascript运行到这个语句时&#xff0c;会立即执行move这个函数&am…

vue import组件的使用

vue import组件的使用 1新建/src/component/firstcomponent.vue <template><div id"firstcomponent"><h1>I am a title.</h1></div> </template>2在app.vue引入组件 并且注册 <script> import firstcomponent from ./comp…

牵丝戏

余少能视鬼&#xff0c;尝于雪夜野寺逢一提傀儡翁&#xff0c;鹤发褴褛&#xff0c;唯持一木偶制作极精&#xff0c;宛如娇女&#xff0c;绘珠泪盈睫&#xff0c;惹人见怜。 时云彤雪狂&#xff0c;二人比肩向火&#xff0c;翁自述曰&#xff1a;少时好观牵丝戏&#xff0c;耽…

机器学习之EM算法的原理推导及相关知识总结

文章目录1、知道先验概率和后验概率2、了解高斯混合模型GMM3、通过最大似然估计推导EM算法的过程的实例4、EM算法5、知道pLSA模型1、知道先验概率和后验概率 先验概率&#xff08;prior probability&#xff09;是指根据以往经验和分析得到的概率&#xff08;理解为自定义概率…