二、线性回归

一、回归

可以拿正态分布为例,比如身高,若平均身高为1.78m,绝大多数人都是1.78m左右,超过2m的很少,低于1m的也不多。
很多事情都会回归到一定的区间之内,即回归到平均值。

机器学习没有完美解,只有最优解。
机器学习的目的就是要以最快的速度,找到误差最小的那个最优解。

二、线性回归

线性:一次方关系,y=a+b*x,各点连接可以形成一条直线。
线性即量与量之间按比例、呈直线的关系,在空间和时间上代表规则和光滑的运动。
x是影响y的因素或维度
总结起来:线性回归就是①数据y和x呈一次方关系、②数据中的每条记录都符合正态分布

三、最小二乘法

在这里插入图片描述
例如:y = a * x + b,(x1,y1),(x2,y2),(x3,y3),(x4,y4),因为是一元一次函数,其实只需要两个点就可以确定出a和b的值,但实际上会有很多的数据点,此时就需要两两组合,分别求出a和b的值,对应不同的a和b求得的y’值是不相同的,分别代入损失函数中去,求得损失函数的值,找取最小的a和b的值,即为最优解,该a和b参数就是我们要求的最优解。

假设有m个样本点,y’为直线上的点,y为真实点的位置,一个样本误差为y’-y。
通常把损失函数loss定义为:在这里插入图片描述
我们的目的就是尽可能使得loss损失函数值最小,找到那个最优参数a和b。

四、多元线性回归

现实生活中,对数据的分析不可能仅仅一个自变量,绝大多数情况都是多个自变量进行分析。
多元线性也就是多元一次函数。本质就是算法(公式)变换为了多元一次方程组。一般来讲W和X都是n维列向量。
在这里插入图片描述,一般情况下x0恒为1,目的是方便转换为矩阵进行求解。

在这里插入图片描述,其中x1,x2…xn表示n个样本点。
也常表示为:在这里插入图片描述,其中ε为误差就等价于随机变量,θ就是W,y表示真实值,θTx为预测值。真实值=预测值+误差。

五、最大似然估计

最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数
似然likelihood,也就是可能性,与probabilite概率的同义词可以互换。

六、中心极限定理

中心极限定理是概率论中讨论随机变量序列部分和分布渐进于正态分布的一类定理。
这组定理是数理统计和误差分析的理论基础,指出了大量随机变量积累分布函数逐点收敛到正态分布的积累分布函数的条件。
它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。

七、误差

第i个样本实际的值(y) = 预测的值(y’) + 误差(ε)
假定所有的样本都是独立的,有上下的震荡,震荡认为是随机变量,足够多的随机变量叠加之后形成的分布,根据中心极限定理,它服从的就是正态分布,因为它是正常状态下的分布,也就是高斯分布。均值和方差都是某个具体的值。
既然误差符合均值为0,方差为平方的正态分布,那么就可以把它的概率密度函数给写出来。

八、概率密度函数

最简单的概率密度函数是均匀分布的密度函数。
最简单的概率密度函数是均匀分布的 密度函数,也就是说,当x不在[a,b]上的时候,函数值等于0;而在区间[a,b]上的时候,函数值等于这个函数。这个函数并不是完全的连续函数,但是它是可积函数。
在这里插入图片描述

正态分布是重要的概率分布,它的概率密度函数是:在这里插入图片描述,随着参数μ和σ的变化,概率分布也产生变化。

真实值 = 预测值 + 误差,ε误差等价于随机变量,目的是用ε代替(x-μ)。
把公式公式代入上述概率密度函数中得:
在这里插入图片描述,求得第i个样本的概率密度。
在这里插入图片描述,把误差ε用表达式代替,得出第i个样本的最大似然估计函数。

概率密度不等于概率,但是概率密度跟概率是等价的。就类似 你不知这个人的体型,但是你知道他穿的衣服的长度等信息。
上述为一个样本的概率密度,要求所有样本的概率密度即:
最大总似然估计函数(likelihood):
在这里插入图片描述
连乘确实优点麻烦,故想到了通过对数函数运行进行转换为连加。
在这里插入图片描述
前半部分是个常数,为了简化操作,将后半部分提出来,形成一个新的目标函数。
最终得到目标函数:
在这里插入图片描述
要求L(θ)最大,即等价于求解J(θ)最小,我们关系的不是J(θ),我们要找的只是θ取何值,J(θ)最小,关心的是θ!

九、总结

Ⅰ为什么求总似然的时候,要用正态分布的概率密度函数?
答:因为中心极限定理可以得知,如果假设样本之间是独立事件,误差变量随机产生,那么它就服从正态分布。

Ⅱ总似然不是概率相乘吗?为什么用概率密度函数进行相乘?
答:因为概率不好求,所以当找到概率密度相乘最大的时候,就相当于找到了概率相乘最大的时候。

Ⅲ概率为什么不好求?
答:概率在正态分布中表示的时候面积,面积需要积分,然而我们的样本都是离散的点,故真正的面积是无法积分出来的,即概率不好求。

Ⅳ总似然最大和最优解有啥关系?
答:当找到可以使得总似然最大的条件,也就可以找到DataSet数据集最吻合某个正态分布,即找到了最优解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/377846.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【转】HMM学习最佳范例五:前向算法1 .

五、前向算法(Forward Algorithm) 计算观察序列的概率(Finding the probability of an observed sequence) 1.穷举搜索( Exhaustive search for solution)  给定隐马尔科夫模型,也就是在模型参…

leetcode 349. 两个数组的交集 思考分析

题目 给定两个数组&#xff0c;编写一个函数来计算它们的交集。 1、暴力双for循环 class Solution { public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {vector<int> result;vector<int> res;if(nums1.siz…

三、梯度下降法求解最优θ值

一、梯度下降法(GD&#xff0c;Gradient Descent) Ⅰ、得到目标函数J(θ)&#xff0c;求解使得J(θ)最小时的θ值 当然&#xff0c;这里只是取了俩特征而已&#xff0c;实际上会有m个特征维度 通过最小二乘法求目标函数最小值 令偏导为0即可求解出最小的θ值&#xff0c;即…

leetcode 131. 分割回文串 思考分析

题目 给定一个字符串 s&#xff0c;将 s 分割成一些子串&#xff0c;使每个子串都是回文串。 返回 s 所有可能的分割方案。 思考 问题可以分为两个子问题&#xff1a;1、判断回文串2、分割数组 判断回文串 bool isPalindrome_string(string s,int startindex,int endinde…

android淡入淡出动画_在Android中淡入动画示例

android淡入淡出动画1) XML File: activity_main 1)XML文件&#xff1a;activity_main <?xml version"1.0" encoding"utf-8"?><android.support.constraint.ConstraintLayout xmlns:android"http://schemas.android.com/apk/res/android&…

[慢查优化]联表查询注意谁是驱动表 你搞不清楚谁join谁更好时请放手让mysql自行判定...

写在前面的话&#xff1a; 不要求每个人一定理解 联表查询(join/left join/inner join等)时的mysql运算过程&#xff1b; 不要求每个人一定知道线上&#xff08;现在或未来&#xff09;哪张表数据量大&#xff0c;哪张表数据量小&#xff1b; 但把mysql客户端&#xff08;如SQL…

四、梯度下降归一化操作

一、归一化 Ⅰ什么是归一化&#xff1f; 答&#xff1a;其实就是把数据归一到0-1之间&#xff0c;也就是缩放。 常用的归一化操作是最大最小值归一化&#xff0c;公式如下&#xff1a; 例如&#xff1a;1&#xff0c;3&#xff0c;5&#xff0c;7&#xff0c;9&#xff0c;10…

[转帖][强烈推荐]网页表格(Table/GridView)标题栏和列冻结(跨浏览器兼容)

GridView的标题栏、列冻结效果(跨浏览器版) 本文来源&#xff1a;http://blog.darkthread.net/blogs/darkthreadtw/archive/2009/02/18/supertable-plugin-for-jquery.aspx 稍早发表了GridView 的标题列冻结效果&#xff0c;足以满足工作上的需求&#xff0c;不过存在两个缺点:…

psu是什么电脑配件_PSU的完整形式是什么?

psu是什么电脑配件PSU&#xff1a;电源部门/公共部门事业 (PSU: Power Supply Unit / Public Sector Undertaking) 1)PSU&#xff1a;电源设备 (1) PSU: Power Supply Unit) PSU is an abbreviation of the "Power Supply Unit". PSU是“电源设备”的缩写 。 It is a…

【C++grammar】断言与表达式常量

目录1、常量表达式和constexpr关键字2、断言与C11的静态断言1.1. assert : C语言的宏(Macro)&#xff0c;运行时检测。1.2. assert()依赖于NDEBUG 宏1.3. assert 帮助调试解决逻辑bug &#xff08;部分替代“断点/单步调试”&#xff09;2.1static_assert (C11的静态断言 )2.2.…

一、Arduino UNO R3将数据上传至云平台

一、准备工作 ①ESP12E Shield ②Arduino UNO R3开发板 ③把ESP12E Shield安装到Arduino UNO R3开发板上 ④登录物联网平台注册个账号&#xff0c;到时候需要使用。 ⑤记录下来你的Uid和key到时候会用到 ⑥创建个设备&#xff0c;用于测试 ⑦beyondyanyu为设备名&…

leetcode 93. 复原IP地址 思考分析

题目 给定一个只包含数字的字符串&#xff0c;复原它并返回所有可能的 IP 地址格式。 有效的 IP 地址 正好由四个整数&#xff08;每个整数位于 0 到 255之间组成&#xff0c;且不能含有前导 0&#xff09;&#xff0c;整数之间用 ‘.’ 分隔。 例如&#xff1a;“0.1.2.201” …

二、通过云平台反向控制Arduino UNO R3

该篇博文是在第一篇博文(一、Arduino UNO R3将数据上传至云平台)的基础上进行的 一、云平台发送指令反向控制Arduino UNO R3 ESP12E Shield开关都推到OFF&#xff08;要不然下载会报错&#xff09;&#xff0c;往Arduino UNO R3开发板上下载下面的代码 这段代码进行测试要点&…

【C++grammar】代理构造、不可变对象、静态成员

目录1、Delegation Constructor&#xff08;代理构造&#xff09;1. What is delegating constructor? (什么是代理构造/委托构造)2. Avoiding recursive calls of target constructors (避免递归调用目标ctor)3. 委托构造的好处2、不可变对象和类1、如何让类成为“不可变类”…

RFID模块+WIFI模块+振动传感器+有源蜂鸣器+舵机+Arduino UNO R3所构成的门禁系统模块

该系统模块主要由RFID模块WIFI模块振动传感器有源蜂鸣器舵机Arduino UNO R3组成的门禁系统模块。这里使用舵机充当门锁&#xff0c;用户可以刷卡开门&#xff0c;也可以通过APP控制舵机状态达到开门的效果。若有不法分子想要强行进入室内&#xff0c;对门进行撞击或者人为的破坏…

ESP12E Shield+Arduino UNO R3开发板+DHT11温湿度模块+双色LED灯+有源蜂鸣器+光敏电阻模块+I2CLCD1602液晶显示器所构成的室内检测系统

室内检测系统由ESP12E ShieldArduino UNO R3开发板DHT11温湿度模块双色LED灯有源蜂鸣器光敏电阻模块I2CLCD1602液晶显示器所构成。DHT11温湿度模块获取室内温湿度数据通过I2CLCD1602液晶显示器进行显示&#xff0c;另一方面通过ESP12E Shield将数据上传至云平台。光敏电阻进行捕…

leetcode 202. 快乐数 思考分析(哈希集合与双指针解)

1、题目 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」定义为&#xff1a;对于一个正整数&#xff0c;每一次将该数替换为它每个位置上的数字的平方和&#xff0c;然后重复这个过程直到这个数变为 1&#xff0c;也可能是 无限循环 但始终变不到 1。如果 可以变为 1&am…

五、线性回归和多项式回归实现

官网API 一、线性回归 针对的是损失函数loss faction Ⅰ、Lasso Regression 采用L1正则&#xff0c;会使得w值整体偏小&#xff1b;w会变小从而达到降维的目的 import numpy as np from sklearn.linear_model import Lasso from sklearn.linear_model import SGDRegresso…

深发展银行编码器(解剖)

电池拆下来&#xff0c;再装上&#xff0c;还能继续用下&#xff0c;不会被重置 转载于:https://www.cnblogs.com/ahuo/archive/2012/01/25/2329485.html

leetcode 1. 两数之和 思考分析

1、题目 给定一个整数数组 nums 和一个目标值 target&#xff0c;请你在该数组中找出和为目标值的那 两个 整数&#xff0c;并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是&#xff0c;数组中同一个元素不能使用两遍。 2、思考分析 双for循环的时间复杂度…