opencv机器学习线性回归_Python机器学习之?线性回归入门(二)

29a2258b4a045e8b115def98f2c89bc1.png

线性回归原理介绍

文章目录

  • 机器学习分类
  • 线性回归原理
  • 线性回归定义
  • 线性回归背后矩阵运算

机器学习分类

机器学习的主要任务便是聚焦于两个问题:分类和回归

  1. 分类相信大家都不会陌生,生活中会见到很多的应用,比如垃圾邮件识别、信用卡发放等等,就是基于数据集,作出二分类或者多分类的选择
  2. 回归会给出一个具体的结果,例如房价的数据,根据位置、周边、配套等等这些维度,给出一个房价的预测

机器学习在不同的维度会有不同的划分,最普遍的划分大致可以分为监督学习、非监督学习、半监督学习、增强学习

监督学习的数据集拥有既定的标签,即训练的数据集已经有了某种特定的属性,例如医院有很多病人的数据,可以根据患者的数据进行病情的鉴定、银行有很多人的信用信息,根据这些信息可以判定申请人的信用程度等等。

非监督学习的数据集没有任何既定标签,完全让算法去分析这些数据,找出一些特殊情况,大多数聚类算法都是非监督学习。

半监督学习,虽然数据集有既定标签,但是有时候有些数据会有缺失,例如银行信用体系中,有些人的年龄数据缺失、有些人性别数据缺失等等。

增强学习,即根据当下的环境不断的去学习,不断的发现数据集,不断的训练自己,例如阿尔法狗以及无人驾驶等,都是增强学习的应用。

线性回归原理

下面的数据很容易获得房屋面积与价格之间的关系面积 * 2.1 = 价格,在二维的线性关系公式为:y = kx + b 添加b是为了单个特征的情况更通用,例如x=0时y可以不经过原点

d40a121913d539181b3adf0971e3c527.png

如果是多个特征例如房子重要的两个参数 面积,位置。那么多特征公式为:k1房子面积 + k2房子位置 + b

线性回归定义

线性回归通过一个或者多个自变量与因变量之间进行建模的回归分析,其中可以为一个或者多个自变量之间的线性组合

  1. 一元线性回归:涉及到的变量只有一个
  2. 多元线性回归:涉及到的变量两个或者两个以上
b87b2d45f615b510e8572e7cb12528c3.png

线性回归背后矩阵运算

矩阵乘法必须满足特定条件:(m行,L列) * (L行,n列) = (m行,n列), 矩阵的乘法背后的业务逻辑就是多元线性回归的公式

b78fa6287021a19874a401234e4f41dd.png
01db88384fdd5ef821024bb64f422f81.png

sklearn机器学习框架

文章目录

  • sklearn库简介
  • Sklearn体系结构
  • 加载数据
  • 区分测试集训练集

sklearn库简介

Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一

  1. Classification 分类
  2. Regression 回归
  3. Clustering 非监督分类
  4. Dimensionality reduction 数据降维
  5. Model Selection 模型选择
  6. Preprocessing 数据预处理

Sklearn体系结构

65cb5c0afb3e87301a566f48f04f8e77.png
  1. 分类和回归是监督式学习,即每个数据对应一个 label。
  2. 聚类 是非监督式学习,即没有 label。
  3. 另外一类是 降维,当数据集有很多很多属性的时候,可以通过 降维 算法把属性归纳起来。例如 20 个属性只变成 2 个,注意,这不是挑出 2 个,而是压缩成为 2 个,它们集合了 20 个属性的所有特征,相当于把重要的信息提取的更好,不重要的信息就不要了。

加载数据

通过pandas可以很方便加载csv,excel,sql,html,json中的数据,加载成功默认保存为DataFrame对象。

9cf96119cedfdbdcfe15e39e60931a1e.png

区分测试集训练集

a2cdfef90c1b548bfc5377e2e734b946.png

线性回归极简案例

文章目录

  • 使用模型的步骤
  • 训练本质就是找权重与偏置
  • 测试集与绝对值误差

使用模型的步骤

Sklearn 把所有机器学习的模式整合统一起来了,学会了一个模式就可以通吃其他不同类型的学习模式

  1. 导入模块
  2. 读入数据
  3. 建立模型
  4. 训练与测试

训练本质就是找权重与偏置

f3918850b5657f9715fd0f061f536d03.png

测试集与绝对值误差

15d515b10ec18773ef44029d7c8b5a11.png

线性回归的缺点

文章目录

  • 单项式缺点
  • 构建单项式回归
  • 单项式缺点

y = wx + b 这种单项式在数学模型中表示一根直线,但是生产环境中很多的数据例如股票,销售涨跌它都是曲线结构的,这就会导致单项式的线性回归预测率低

构建单项式回归

大家可以看到,单项式线性回归在可视化中生成的就是一条直线,直线的情况下预测曲线的真实数据是非常低的,因此一章节我们就来看如何采用多项式预测曲线数据

b88b6d7928d7009e31c4f42c365c5f8a.png
133e0dacc50b5663cee0e0f5d2fdec3c.png

手写多项式回归

文章目录

  • 多项式回归场景
  • 创建待分析的样本
  • 多项式预测样本

多项式回归场景

直线回归研究的是一个依变量与一个自变量之间的回归问题,但是,在畜禽、水产科学领域的许多实际问题中,影响依变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重、胸围、体长等多个变量的影响,因此需要进行一个依变量与多个自变量间的回归分析,即多元回归分析

研究一个因变量与一个或多个自变量间多项式的回归分析方法,称为多项式回归(Polynomial Regression)。如果自变量只有一个时,称为一元多项式回归;如果自变量有多个时,称为多元多项式回归。在一元回归分析中,如果依变量y与自变量x的关系为非线性的,但是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归

一元m次多项式回归方程为:

f535ba3294094f91f9c0af70b1099dd7.png

二元二次多项式回归方程为:

31b4bf8e24d09aa0db0bb586244b4fd7.png

创建待分析的样本

47633246c39af07054ab97ccc2c42ec5.png
667df4bcfdb9284e716df2871d047925.png

多项式预测样本

5cad3e3e4176aafc1ad903940750f62f.png
6bf079e589b9f0ef6d3728e47ffa8483.png
4f88889e169b8ddefcb1064ba602e9be.png
88b257a1b7d35ab1336efe412b2e1925.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505288.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php 邮件发送是html 没样式_使用python发送邮件

发送邮件这个功能非常实用,比如你写了一个爬虫,可以通过邮件来接收程序异常或者任务完成的通知,再比如你搭了一个网站,别人只需留下他的邮箱,你就可以自动给他发送邮件。总之我觉得邮件通知非常适合那些处理批量、大量…

cyber atomic hash map

整体结构 cyber atomic hash map是用一个数组存储桶(bucket),桶是一个链表的形式存储值,每一个结点是个entry,哈希冲突的解决方法是链地址法。 整体结构 --- entry entry为bucket链表的结点单位,代码&am…

easypoi设置黑色边框_迷人的G-SHOCK MTG-B1000XBD,碳纤维与黑色金属的魅力

美国最大的奢侈腕表盛会,第五届纽约WatchTime于2019年10月25日至26日在曼哈顿中城的Gotham Hall举行,共有37个参展品牌展出了最新的腕表款式,卡西欧(Casio)在G-SHOCK高级系列MT-G中展示了最新作品“ MTG-B1000XBD”和“ MTG-B1000…

python创建空字典_Python创建和访问字典

>>> dict1 {a:1,b:2,c:3,d:4} >>> print(a的值是:,dict1[a]) a的值是: 1 >>> dict4 dict(我 快乐, 你 伤悲) SyntaxError: keyword cant be an expression >>> dict4[你] 改变悲伤 >>> dict4 {我: 快乐, 你: 改变悲伤} >…

c语言 单词变复数_【热点】浅谈 :怎样学好C语言?

是新朋友吗?记得先点蓝字关注我哦~本文共 1900 字,预计阅读时间: 7 分钟。最近有好多朋友和我抱怨说C语言真的太难学了,你有没有什么好的意见?嗯,的确如此,我上个学期学C语言的时候也…

python库路径_如何设置本地python库目录/ PYTHONPATH?

在尝试编写今天使用PIL的 Python脚本的过程中,我发现我似乎没有在我的本地计算机上使用它(OS X 10.5.8,默认2.5 Python安装). 所以我跑: easy_install --prefix/usr/local/python/ pil 它有点抱怨/usr/local/python/lib/python2.5/site-packages尚未存在,所以我创建…

安川机器人报错代码_今日 IPO|对标库卡机器人的先惠技术上市 近八成收入靠上汽...

面对全球金融体系的重构,与中国资本市场的变革。「晚点」希望从小处入手,以每日 IPO 公司的快速报道,记录这个时代的变化。通过「晚点早知道」,我们希望可以让读者只需要花几分钟时间,就可以了解到当天上市公司里&…

htmlplay前端编辑器下载_2019年最好用的代码编辑器推荐

对于经常需要编写代码的程序员来说,拥有一款自己的编辑器是非常重要的事情,一款好用的代码编辑器往往能够让代码的编辑更加流畅,今天我们为大家带来最流行的代码编辑器Sublime TextSublime Text是一款快速轻量可定制的代码编辑器,…

geoserver发布瓦片_Geoserver2.15.1配置自带GeoWebCache 插件发布ArcGIS Server瓦片

之前写过一篇关于 Geoserver2.8.5 版本的部署配置发布 ArcGIS Server 瓦片点击查看,那是下载 Geoserver2.8.5 源码编译,重新打包 jar 来部署配置思路的,版本也比较旧。最近我想升级 Geoserver 版本,所以从官网下载最新版本 Geoser…

32 块大小_详解Linux文件系统的完整结构--引导块、超级块、GDT等

概述今天主要介绍一下Linux系统的文件系统,一起来看看吧~文件系统组成网上看到的一张完整的文件系统图,如下:首先,该图中有Boot Block、Super Block、GDT、Reserver GDT这几个概念,下面会分别介绍它们。然后&#xff0…

pythonista脚本_IPA Installer脚本下载-Pythonista脚本IPA Installer(安装手机ipa文件) - 极光下载站...

pythonista脚本IPA Installer,通过这个脚本,无需电脑,也可有让iOS苹果手机用户端轻松安装ipa文件,非常实用。安装速度快,没有大小限制。 主要特点: 无需上传,本地安装 没有大小限制 安装速度快 …

channelsftp 上传文件为空_SpringBoot文件上传下载篇(九)

点击上方蓝色字体,关注我们上传文件是互联网中应用的场景之一,最典型的情况就是上传头像。文件上传主要是将文件通过IO流传输到服务器的某一个特定的文件夹下。Why->MultipartFile?解析源码:public interface MultipartFile extends InputStreamSour…

excel 科学计数法转换成文本完整显示_表格技巧—Excel里身份证号码显示不全的多种解决办法...

运用Excel表格可以快速统计和汇总数据,那么当在表格当中输入身份证号码时,表格通常显示不完全,这是为什么呢,今天小编就来给大家详细介绍当身份证号码显示不全时的多种解决办法,一起来学习一下吧。首先,我们…

sublime运行python代码_怎么用sublime运行python

首先需要安装一个Sublime Text(http://www.sublimetext.com/)和一个Python(https://www.python.org/downloads/)接下来打开Sublime Text:1、如下图所示,点击菜单栏中的Tools —> Build System —> New Build System(系统默认选择的是Automatic&…

nginx header参数丢失_某Nginx后门分析与重现

安全分析与研究专注于全球恶意软件的分析与研究背景前几天,接到一个nginx后门样本,本着就分析和复现的思路,完整的将整个过程做一次复现,不料最终还获取到了后门的核心代码部分,遂将其整理发布,仅供学习研究…

bch纠错码 码长8_浅析BCH码的编码方法.docx

浅析BCH码的编码方法浅析BCH码的编码方法0 引言数字信号在传输系统中传输时,不免会受到各种因素的干扰,使到达接收端的数字信号中混有噪声,从而引发错误判决。为了抗击传输过程中的干扰,必然要利用纠错码的差错控制技术。BCH码是纠…

virtual box一直正在加载文件_Linux基础导航与文件管理

Linux基础导航与文件管理对于新手,或许很关心如何通过命令行来控制操作系统。这编文章将会尝试带你快速熟悉Linux系统基础,但是不会覆盖所有的Linux系统知识,在未来对Linux探索过程中会有很大的帮助。本篇文章继续学习Linux基础。准备与目标在…

高德地图各种摄像头图标_高德导航中,限速摄像头,违章摄像头,监控摄像头各有什么区别...

展开全部限速摄像头e69da5e6ba903231313335323631343130323136353331333365666163是测速用的,超过限制时速就会抓拍,一般都是两个点中间的距离固定,分别拍照进入分析系统记录,超出时速限制,就会记录违章了。违章摄像头…

go去掉最后一个字符_Go语言去除字符串中的指定字符

Go语言中常用的去除字符串中指定字符的方法如下表所示。 表:字符串处理函数 方法功能描述 func Trim(s string, cutset string) string 将字符串 s 首尾包含在 cutset 中的任一字符去掉返回 func TrimFunc(s string, f func(rune) bool) string 将字符串 s 首尾满足函数 f(r)=…

打开fiddler后打不开网页_如何通过fiddler的导入导出功能,保存一份分类管理的请求报文...

在使用fiddler抓取请求报文时,我们更习惯于直接操作APP或者web系统,然后到fiddler中找我们想要的数据报文。但若这些报文是我们经常要看的 ,我们可以使用另外一种更简单的方式来查看,那就是把我们想要的报文保存到本地&#xff0c…