深度神经网络——什么是线性回归?

线性回归是一种用于预测或可视化的算法 两个不同特征/变量之间的关系。 在线性回归任务中,要检查两种变量: 因变量和自变量。 自变量是独立的变量,不受其他变量的影响。 随着自变量的调整,因变量的水平将会波动。 因变量是正在研究的变量,也是回归模型求解/尝试预测的变量。 在线性回归任务中,每个观察/实例都由因变量值和自变量值组成。

这是对线性回归的快速解释,但让我们通过查看线性回归的示例并检查它使用的公式来确保我们更好地理解线性回归。

了解线性回归

假设我们有一个涵盖硬盘驱动器大小和这些硬盘驱动器成本的数据集。

假设我们拥有的数据集由两个不同的特征组成:内存量和成本。 我们为计算机购买的内存越多,购买成本就越高。 如果我们在散点图上绘制各个数据点,我们可能会得到如下所示的图表:

确切的内存成本比可能因硬盘驱动器制造商和型号而异,但总的来说,数据趋势是从左下角开始(硬盘驱动器更便宜且容量更小),然后移动到右上角(驱动器更昂贵且容量更大)。

如果 X 轴上有内存量,Y 轴上有成本,则捕获 X 和 Y 变量之间关系的线将从左下角开始,一直延伸到右上角。

回归模型的功能是确定 X 和 Y 变量之间的线性函数,该函数最能描述两个变量之间的关系。 在线性回归中,假设 Y 可以通过输入变量的某种组合来计算。 输入变量 (X) 和目标变量 (Y) 之间的关系可以通过在图中的点画一条线来描绘。 该线代表最能描述 X 和 Y 之间关系的函数(例如,每次 X 增加 3,Y 增加 2)。 目标是找到最佳“回归线”,或最适合数据的线/函数。

线通常由等式表示: Y = m ∗ X + b Y = m*X + b Y=mX+b。 X 指因变量,Y 指自变量。同时,m 是线的斜率,由“上升”相对于“运行”的定义。机器学习从业者以稍微不同的方式表示著名的斜线方程,而是使用以下方程:

y ( x ) = w 0 + w 1 ∗ x y(x) = w0 + w1 * x y(x)=w0+w1x

在上式中,y是目标变量,“w”是模型参数,输入是“x”。 因此,该方程可解读为:“根据 X 给出 Y 的函数等于模型参数乘以特征”。 在训练过程中调整模型的参数以获得最佳拟合回归线。

多元线性回归

上述过程适用于简单线性回归,或仅存在单个特征/自变量的数据集的回归。 然而,回归也可以用多个特征来完成。 如果是 ”多元线性回归”,该方程通过数据集中找到的变量数量进行扩展。 换句话说,常规线性回归的方程为 y ( x ) = w 0 + w 1 ∗ x y(x) = w0 + w1 * x y(x)=w0+w1x,而多元线性回归的方程为 y ( x ) = w 0 + w 1 ∗ 1 y(x) = w0 + w1*1 y(x)=w0+w11 加上各种特征的权重和输入。 如果我们将权重和特征的总数表示为 w(n)x(n),那么我们可以表示如下公式:

y ( x ) = w 0 + w 1 ∗ 1 + w 2 ∗ 2 + … + w ( n ) ∗ ( n ) y(x) = w0 + w1*1 + w2*2 + … + w(n)*(n) y(x)=w0+w11+w22++w(n)(n)

建立线性回归公式后,机器学习模型将使用不同的权重值,绘制不同的拟合线。 请记住,目标是找到最适合数据的线,以便确定哪种可能的权重组合(以及哪种可能的线)最适合数据并解释变量之间的关系。

成本函数用于测量给定特定权重值时假设的 Y 值与实际 Y 值的接近程度。 成本函数 线性回归是均方误差,它只取数据集中所有不同数据点的预测值和真实值之间的平均(平方)误差。 成本函数用于计算成本,该成本捕获预测目标值与真实目标值之间的差异。 如果拟合线距离数据点较远,则成本会较高,而线越接近捕获变量之间的真实关系,成本就会越小。 然后调整模型的权重,直到找到产生最小误差的权重配置。

Python实现

from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt# 示例数据
X = np.array([1, 2, 3, 4, 5]).reshape((-1, 1))  # 特征集
y = np.array([2, 4, 5, 4, 5])  # 目标值# 创建线性回归模型实例
model = LinearRegression()# 训练模型
model.fit(X, y)# 进行预测
y_pred = model.predict(X)# 可视化
plt.scatter(X, y, color='blue')  # 绘制原始数据点
plt.plot(X, y_pred, color='red')  # 绘制最佳拟合线
plt.title('Linear Regression with scikit-learn')
plt.xlabel('X')
plt.ylabel('y')
plt.show()# 查看模型参数
print(f'Slope (weight): {model.coef_[0]}')
print(f'Intercept: {model.intercept_}')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/19903.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三体中的冯诺依曼

你叫冯诺依曼,是一位科学家。你无法形容眼前的现态,你不知道下一次自己葬身火海会是多久,你也不知道会不会下一秒就会被冰封,你唯一知道的,就是自己那寥寥无几的科学知识,你可能会抱着他们终身,…

《QT实用小工具·六十九》基于QT开发的五子棋AI游戏

1、概述 源码放在文章末尾 该项目实现了五子棋对战AI,可以享受和AI下棋的快乐,项目实现思路如下: 博弈树 ●Alpha-Beta剪枝(性能提高较大) ●启发式搜索(性能提高较大) ●落子区域限制(性能提高较大) ●Zobrist哈希(性能小幅提升) ●Qt…

数据治理基础知识

文章目录 基本概念相关名词术语数据治理对象 基本概念 1)从管理者视角看数据治理 数据治理是企业发展战略的组成部分,是指导整个集团进行数字化变革的基石,要将数据治理纳入企业的顶 层规划,各分/子公司、各业务部门都需要按照企…

软考高级系统规划与管理师适合什么人考?有什么优势?

系统规划与管理师适合什么人考? 适合以下几类人群: 1. 信息技术服务规划人员:从事信息技术服务规划工作,负责制定和优化IT服务规划的人 2. 信息系统运行维护管理人员:负责信息系统日常运行维护、确保系统稳定性和可…

【前端】Mac安装node14教程

在macOS上安装Node.js版本14.x的步骤如下: 打开终端。 使用Node Version Manager (nvm)安装Node.js。如果你还没有安装nvm,可以使用以下命令安装: curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.1/install.sh | bash 然后关…

变压器励磁涌流MATLAB仿真模型

微❤关注“电气仔推送”获得资料(专享优惠) 变压器励磁涌流的产生机理 1、变压器是电力系统的关键部分,在实际的 运行中,变压器需要进行相应的充电,而在充电的过 程中,就需要进行开合闸作业。在开合闸作业…

【Linux】磁盘结构文件系统软硬链接动静态库

目录 一.磁盘结构 1、磁盘的物理结构 2、磁盘的存储结构 3、磁盘的逻辑结构 二.文件系统 1、对IO单位的优化 2、磁盘分区与分组 3、对分组的具体管理方法 4、文件操作 三.软硬链接 1、理解硬链接 2、理解软连接 3、理解.和.. 四、动静态库 1、什么是动静态库 2、…

Flutter基础 -- Dart 语言 -- 基础类型

目录 0. 配置 1. 变量 1.1 弱类型 var Object dynamic 1.2 强类型 1.3 使用场景 var 简化定义变量 查询参数定义 返回的实例对象 2. 常量 final 和 const 2.1 相同点 类型声明可以省略 初始后不能再赋值 不能和 var 同时使用 2.2 不同点 const 需要确定的值 …

线性代数|机器学习-P1课程简介

文章目录 1. 书籍下载2. 正文 1. 书籍下载 链接:https://pan.baidu.com/s/1QbK0enLh0x4nU1c4Tqwlkw 提取码:r7ft 本课程回顾线性代数在概率论、统计学、优化和深度学习中的应用。是GILBERT STRANG教授的有一个经典的课程。课程将线性代数分为如下部分&a…

利用“记忆化搜索“解斐波那契数

一、题目描述 求第 n 个斐波那契数。 二、 利用"记忆化搜索"解斐波那契数 什么是记忆化搜索?记忆化搜索就是带有备忘录的递归。 我们先来看一下使用递归来解斐波那契数的这个过程,假设求第5个斐波那契数F(5)。 由图可见,要重复计…

Android加固多渠道打包和签名工具

简介 基于腾讯VasDolly最新版本3.0.6的图形界面衍生版本,同时增加了签名功能,旨在更好的帮助开发者构建多渠道包 使用说明 下载并解压最新工具包,找到Startup脚本并双击启动图形界面(注意:需本地安装java环境&#…

手机定制开发_基于天玑900的5G安卓手机定制方案

手机定制方案基于联发科天玑900强劲旗舰八核2.4GHz处理器。这款处理器采用了6nm先进制程工艺,为用户带来了痛快淋漓的性能体验。不论是进行游戏还是日常娱乐,用户都能轻松驾驭。手机搭载了最新的Android 13操作系统,提高了数据读取的准确性&a…

小数第n位【蓝桥杯】

小数第n位 模拟 思路&#xff1a;arr数组用来记录已经出现过的a&#xff0c;在循环时及时退出。易知题目的3位即a%a后的第n-1,n,n1位。该代码非常巧妙&#xff0c;num记录3位的输出状况。 #include<iostream> #include<map> using namespace std; typedef long l…

vulnhub靶场之FunBox-9

一.环境搭建 1.靶场描述 Its a box for beginners, but not easy. Gather careful !!! Hint: Dont waste your time ! Every BruteForce-Attack at all ports can be stopped after 1500 trys per account. Enjoy the game and WYSIWYG ! This works better with VirtualBox…

博士毕业论文/CTEX/LATEX

LATEX环境安装 CTEX 安装 &#xff08;垃圾&#xff0c;不要装&#xff09; 运行 clean.batcomp.bat 缺少字体 Couldn’t find Adobe Heiti S.cfg’ miktex-maketfm: No creation rule for font “Adobe Heiti Std”.解决方法&#xff1a;其实就是下载这四个字体之后&…

【大比武10】行业垂直大模型应用在档案管理中的探索

关注我们 - 数字罗塞塔计划 - # 大比武2024 本篇是参加“华夏伟业”杯第二届档案信息化公司业务与技术实力大比武&#xff08;简称“大比武 2024”&#xff09;的投稿文章&#xff0c;来自广州龙建达电子股份有限公司&#xff0c;作者&#xff1a;陶宣任。 在这个人工智能技…

深入理解flask规则构建与动态变量应用

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、引言 二、Flask规则基础 1. 静态规则与动态规则 2. 规则语法与结构 三、动态变量应用…

CISCN 2022 初赛 ez_usb

还是从第一个 URB向后看 发现 同时 存在 2.8.1 2.10.1 2.4.1 但是显然 2.4.1 是7个字节 不满足 usb流量要求 只考虑 2.8.1 和 2.10.1 tshark -r ez_usb.pcapng -T json -Y "usb.src \"2.8.1\"" -e usbhid.data > 281.json 正常取数据即可 import js…

【vue】v-for只显示前几个数据,超出显示查看更多

v-for只显示前几个数据&#xff0c;超出显示查看更多 如图 <div v-for"(item,index) in list.slice(0,3)" :key"index"><div class"degreeNo" :class"index0?noOne:index1?noTwo:index2?noThree:"> NO{{index1}}:<…

读《Diffusion Models: A Comprehensive Survey of Methods and Applications》综述

读《Diffusion Models: A Comprehensive Survey of Methods and Applications》综述 关于此文&#xff0c;我的一个见解想法&#xff0c;重点关注他怎么描述 「Diffusion Model」的引用的&#xff0c;以及未来方向就好了。当然从这篇文章可以知道 「Diffusion Model」的一个基石…