高斯拟合 vc++代码_NMA2020W1 极大似然法模型拟合与bootstrap

329ef55dab3743f0dacb945719d08126.png

常见的线性模型:

求解方式有两种,一种是计算均方误差(MSE),使得均方误差最小。

a15418200262b52c4be3d627ed485217.png
图1

找到梯度为零的点即可。

而之前一直比较模糊的最大似然法也比较清楚了。一般线性模型,我们假定误差项是符合高斯分布的,高斯分布的概率密度函数为:

这里x即为原始值,

为估计值,原始描述的是原始点在均值周围的分布,现在改成估计值围绕原始值的分布即可。以下便是线性模型的似然函数

我们要找的就是使得p值最大的theta。取log是为了求值的方便,下面的推导直接把前面部分分离出来了,因为是个常数,可以直接不看,看后半部分就行了。

0d84d82b288a17610dda1dfe4a62f928.png
图2

这样,我们看只要求后半部分的极值就行了,由于是负号,求其最大值就是求不带负号的最小值,这样就跟MSE的公式几乎一样了。

84632775e228bab383ca76881e6d2a76.png
图3

从概念上讲就是,由于误差项是高斯分布的,而估计值是一个确定值,所以当前真实值其实是落在以估计值为中心的高斯分布上的,如下

cd86efea4b904a24ca31fce63f8929e3.png
图4

我们想要估计值尽可能等于真实值,那么使真实值最好就落在高斯分布的最高点上,即概率最大点,所以我们把每个真实值的落在各自估计值的高斯分布的概率加起来最大,就可以说是最佳的拟合程度了。由于加了log,所以累加在图2中变成了累乘。

ce61cea3a2b1589c58e4c16cbafc6b4b.png
图5

而这个极大似然估计也概念化地解释了过拟合欠拟合中地bias-variance问题,variance就是指这个分布地宽窄,如果过宽,variance过大,即我们的模型变异很大,可能加一个或减一个数据,参数都会变很多。

而估算variance可以用bootstrap来做,bootstrap的过程就是,加入我们有10各样本,就取随机在10个样本中抽取10个样本,但是抽取方式是可以重复的,因此我们又得到了10个样本,只是可能有重复样本。

c866bae16f7497788c8c562d7af468f9.png
图6

看一下代码就很清楚了。

def resample_with_replacement(x, y):"""Resample data points with replacement from the dataset of `x` inputs and`y` measurements.Args:x (ndarray): An array of shape (samples,) that contains the input values.y (ndarray): An array of shape (samples,) that contains the correspondingmeasurement values to the inputs.Returns:ndarray, ndarray: The newly resampled `x` and `y` data points."""# Get array of indices for resampled pointssample_idx = np.random.choice(len(x), size=len(x), replace=True)# Sample from x and y according to sample_idxx_ = x[sample_idx]y_ = y[sample_idx]return x_, y_

19e634b217674166d65debf4dd4da46a.png
图7

这样就可以通过bootstrap来估计出我们参数的置信区间,虽然我们无从知道真实值是什么样的,但是给一个区间总比一个点信息更多一点。当然有的显著性检验应该可以用这个区间有没有过0点来做。

除了bootstrapping可以给出模型的variance,还可以使用交叉验证的方法评估模型,把所有数据分成n块,每次用其中一块做验证集,其他为测试集。是测试集的平均正确率来判断模型表现。这里要注意,一般都会做标准化,不能在划分验证集和测试集之前做,这样会带来很多的假阳性。一个办法是对训练集标准化,然把用得到的标准化参数应用到测试集上。

以上,我们的假设是误差项为高斯分布,而不是所有都符合高斯分布的,如,如果反应是多个离散值的分布,那么我们的误差项分布使用泊松分布更好。这样就是个非线性的模型了,做起来很简单,只需要在线性模型中间加一步非线性转化,将原来的线性模型得到的输出,套一个非线性方程即可,这也就是所谓的广义线性模型(GLM)。

cd8f34aedd9a47cb4e06007c77dae282.png
图8

而二值分布只需要将非线性方程设置为sigmoid方程,套上即可,这就是Logistic回归。

这样就是可以用glm,只是在原来的线性模型加一步非线性转化就可以结果多样的问题。

1fee40230c88d2440a1f58e6bb25da61.png
图9

使用正则化解决过拟合问题,详见:

https://zhuanlan.zhihu.com/p/146448243​zhuanlan.zhihu.com

上图均来自于NMA2020的tutorial,代码来自示例代码:

https://github.com/NeuromatchAcademy/course-content/tree/master/tutorials​github.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/533613.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java文件快速扫描仪_Java扫描仪具有示例的NextNextShort()方法

扫描仪类hasNextShort()方法语法:public boolean hasNextShort();public boolean hasNextShort(int rad);hasNextShort()方法在java.util包中可用。hasNextShort()方法用于检查此扫描程序在其输入中是否具有下一个标记,是否可以将其作为隐式基数中的shor…

python sqlite并发处理_python sqlite大数据 处理

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台&…

java sax xml文件解析_java解析xml文件-DOM/SAX

java解析xml文件的两种方式1:DOM原理:把整个文档加载到内存,转化成dom树,之后应用程序可以随机的访问dom树的任何数据,灵活 快,但消耗内存一个简单的xml使用java解析//builder工厂DocumentBuilderFactory f…

python现有两个磁盘文件a和b_有两个磁盘文件A和B,各存放一行字母,今要求把这两个文件中的信息合并,输出到一个新文件C中。...

首先,在.cpp所在的文件夹下建立A.txt与B.txt。向其中输入字母。#include#include#includeint main(){FILE *a,*b,*c;char ch[100],outfile[10];int i0,n;void paixu(char a[100],int n);if((afopen("A.txt","r"))NULL){printf("Cant open …

python 远程控制_用 Python 远程控制你的电脑

用 Python 远程控制你的电脑一、前言很多时候我们有这种需求,因为程序运行比较耗时,但是我们没有足够的时间等待。这个时候我们就可以用 Python 做一个远程控制电脑的小工具,实现远程控制电脑。当然,我们能做的操作十分有限&#…

摄像头图像分析目标物体大小位置_一文读懂图像定位及跟踪技术

文 | 传感器技术在科学技术日新月异的今天,人们对机器设备的智能性、自主性要求也越来越高,希望其完全替代人的角色,把人们从繁重、危险的工作任务中解脱出来,而能否像人一样具有感知周围环境的能力已成为设备实现智能化自主化的关…

java 相对路径获取_在java项目中通过相对路径获取资源的方式

1.可以通过 类名.class.getResource方法获取或者getSystemResource2.可以通过当前线程 Thread.currentThread().getContextClassLoader().getResource获取public class TestDemo {public static void main(String[] args) throws FileNotFoundException, IOException {Properti…

python循环嵌套的外循环必须完全包含内循环_Python:循环与嵌套循环实现规律数列...

很多人觉得编程很难,其实换个想法,这就是个用来解决问题的工具,我们为了解决实际问题而来学习和使用编程,这样编程学习有了目的性,动力会更强。就像现在十分热门的Python技术,就是人工智能领域所需求的&…

python爬取正确但不出文件_使用BeautifulSoup进行Python抓取时不显示所有行

我是美容小组的新手。我试图从ESPN Fantasy Basketball Standings中获取“Season Stats”表,但并不是返回所有行。经过一番研究,我认为这可能是一个问题html.parser,所以我用了lxml。我得到了同样的结果。如果有人能告诉我如何得到所有球队的…

pat乙级相当于什么水平_雅思6.5是什么水平?相当于托福多少分?

雅思和托福是当前社会中非母语人士的主流英语水平测试。准备出国留学的学生对这两项考试并不陌生。对于一些学生来说,仅靠雅思成绩并不足以申请他们最喜欢的学校。特别是对于申请北美院校的学生,托福成绩是申请时提交语言成绩的优先考虑事项。那么&#…

java时间方法_JAVA处理日期时间常用方法

转载JAVA处理日期时间常用方法:1.java.util.CalendarCalendar 类是一个抽象类,它为特定瞬间与一组诸如 YEAR、MONTH、DAY_OF_MONTH、HOUR 等 日历字段之间的转换提供了一些方法,并为操作日历字段(例如获得下星期的日期)提供了一些方法。瞬间可…

python气象_Python 在气象上的应用

Python 在气象上的应用0.7892019.03.15 23:19:31字数 913阅读 1,024为什么选择python功能齐全的编程语言,真正面向对象喜欢可读的代码出版质量图绘制轻松读/写netcdf和grib数据轻松使用Fortran / C / C 广泛的库支持数字和非数字工作科学计算1.Numpy  Numpy是pyth…

双飞翼布局内容不换行_web前端入门到实战:圣杯布局和双飞翼布局

稍微了解前端的人都知道,圣杯布局和双飞翼布局是前端面试时必问的问题,因为它既能体现你懂HTML结构又能体现出你对DIVCSS布局的掌握,毕竟我们学习CSS主要就是为了更好地布局带来最好的用户体验嘛~事实上,圣杯布局其实和…

java 去掉 t_关于Java:在LocalDateTime中不能删除“ T”

这是问题所在:GetMapping("/main/search")public String search (RequestParam String departure,RequestParam String arrival,RequestParam String departureTime,Model model) {DateTimeFormatter formatter DateTimeFormatter.ofPattern("yyyy-…

数据结构知识点总结_大牛带你学 | 考研数据结构中线性表中顺序结构的知识点总结...

前言我们都知道,数据结构中逻辑结构可以划分为线性结构(线性表)与非线性结构两大类。而存储结构指的是数据元素在计算机中的存储及其逻辑关系的表现,也就是在计算机当中对逻辑结构的表示。线性表的存储结构主要有顺序结构和链式结构两种实现形式。本文主…

java矩形翻转_如何判断一个点在旋转后的矩形中

前言最近在做的一款游戏中,用到点与旋转矩形的判定来获得一个选中的物体。在此做个记录如图所示,黄色的颜料屏是旋转的,如果不做处理直接判断点是否在矩形中,那么点击红点的位置会判定为选中物体。显然这是不对的。如果物体没有旋…

python中用函数设计栈的括号匹配问题_数据结构和算法(Python版):利用栈(Stack)实现括号的匹配问题...

算法数据结构数据结构和算法(Python版):利用栈(Stack)实现括号的匹配问题在平时写程序当中,我们会经常遇到程序当中括号的匹配问题,也就是在程序当中左括号的数量和右括号的数量必须相等。如果不相等的话则程序必然会报错。Hint:在读取程序的…

python创建空元组_Python——元组的基本语法(创建、访问、修改、删除)

原标题:Python——元组的基本语法(创建、访问、修改、删除)Python 元组的使用Python 的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号 ( ),列表使用方括号 [ ]。元组创建很简单,只需要在括号中添加元素&#xf…

openssl 生成证书_CentOS7 httpd(Apache)SSL 证书部署

在之前我的文章中我已经搭建了nextcloud服务器,现在我们需要通过域名及https访问怎么办1. 进行了简单的httpd设置后,就可以为网站添加SSL证书功能了。2. 首先得获取证书,有了证书才能添加。我们采用本地上传的方式将SSL证书上传到CentOS上。获…

FJ的字符串java问题_蓝桥杯VIP试题 之 基础练习 FJ的字符串- JAVA

问题描述FJ在沙盘上写了这样一些字符串:A1 “A”A2 “ABA”A3 “ABACABA”A4 “ABACABADABACABA”… …你能找出其中的规律并写所有的数列AN吗?输入格式仅有一个数:N ≤ 26。输出格式请输出相应的字符串AN,以一个换行符结束。…