算法金 | 统计学的回归和机器学习中的回归有什么差别?


大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」

统计学中的回归

  1. 目标:
  • 主要用于解释和推断自变量(independent variables)和因变量(dependent variables)之间的关系。
  • 强调模型的解释性,了解各个自变量对因变量的影响。
  • 假设:
  • 假设数据符合特定统计假设,如正态分布、独立性和同方差性。
  • 需要满足严格的模型假设。
  • 模型复杂性:
  • 通常使用简单模型,如线性回归。
  • 模型形式固定,主要是线性或加性模型。
  • 数据量:
  • 通常处理较小的数据集。
  • 评估方法:
  • 强调参数的显著性检验(significance tests)。
  • 使用 R 平方((R^2))和 P 值(P-value)等统计指标。

机器学习中的回归

  1. 目标:
  • 主要用于预测,关注模型的预测性能。
  • 更关注模型的泛化能力(generalization ability),即在新数据上的表现。
  • 假设:
  • 对数据分布和模型形式的假设较少。
  • 灵活性更大,不需要满足严格的统计假设。
  • 模型复杂性:
  • 使用复杂模型,如决策树回归(decision tree regression)、随机森林回归(random forest regression)、支持向量回归(support vector regression)和神经网络(neural networks)等。
  • 模型可以是非线性的,适应复杂数据模式。
  • 数据量:
  • 通常处理大规模的数据集。
  • 评估方法:
  • 使用交叉验证(cross-validation)等方法评估模型性能。
  • 强调预测误差,如均方误差(Mean Squared Error, MSE)和均绝对误差(Mean Absolute Error, MAE)。

总结

  • 统计学中的回归:用于解释和推断变量之间的关系,假设严格,模型简单,适用于小数据集。重点在于理解数据和变量关系,模型解释性强。
  • 机器学习中的回归:用于预测和优化,假设少,模型复杂,适用于大数据集。重点在于提高模型的预测性能,模型灵活性高。

图示解释

  1. 统计学中的线性回归:
  • 图示:数据点分布在图上,一条直线(回归线)穿过数据点,显示自变量与因变量之间的线性关系。
  • 解读:这条直线表示最小二乘法(Least Squares Method)拟合出的最佳线性关系,用于解释 (X) 和 (Y) 之间的关系。
  • 机器学习中的非线性回归:
  • 图示:数据点分布在图上,一条曲线穿过数据点,显示自变量与因变量之间的复杂非线性关系。
  • 解读:这条曲线可能是通过复杂模型(如决策树、神经网络)拟合出的,显示出自变量和因变量之间更复杂的模式和关系。

这两者的差别主要体现在模型的目标、假设、复杂性、数据量和评估方法上,各有其应用场景和优势。

统计学中的回归主要强调模型的解释性和简洁性,因此通常采用简单的线性模型。下面是一些具体原因:

假设和解释性

  1. 解释性:
  • 统计学中的回归模型强调解释变量对因变量的影响。
  • 线性回归模型的系数具有明确的解释意义,可以直接说明每个自变量对因变量的线性贡献。
  • 简洁性:
  • 线性模型较为简单,易于理解和解释。
  • 在变量关系相对简单的情况下,线性模型能有效地捕捉主要趋势。
  • 假设检验:
  • 统计学中的回归依赖于一定的假设,如正态分布、独立性和同方差性。
  • 这些假设在简单的线性模型中更容易满足和检验。

数据量和计算复杂度

  1. 数据量:
  • 统计学方法通常用于较小的数据集。
  • 简单模型在小数据集上表现更好,因为复杂模型容易过拟合。
  • 计算复杂度:
  • 线性回归计算简单,适用于快速分析和建模。
  • 非线性模型(如决策树)计算复杂度较高,训练和预测时间更长。

过拟合和泛化能力

  1. 过拟合:
  • 复杂模型(如右图的决策树回归)容易过拟合,即在训练数据上表现很好,但在新数据上表现不佳。
  • 线性模型的简单性有助于避免过拟合,提升模型的泛化能力。

应用场景

  1. 应用场景:
  • 统计学中的回归主要用于变量关系的探索和解释,如社会科学和经济学研究。
  • 在这些领域,理解变量间的关系和影响是主要目标,而不是追求复杂模型的预测性能。

图示解读

  1. 统计学中的线性回归(左图):
  • 适用于数据关系较简单、主要目标是解释和推断的场景。
  • 线性回归线展示了自变量和因变量之间的线性关系,便于解释。
  • 机器学习中的决策树回归(右图):
  • 适用于数据关系复杂、主要目标是预测和优化的场景。
  • 决策树回归曲线展示了自变量和因变量之间的复杂非线性关系,但解释性较差。

[ 抱个拳,总个结 ]

统计学中的回归更关注模型的简洁性和解释性,适用于变量关系较为简单、数据量较小的场景。因此,通常采用线性回归模型。而机器学习中的回归更多用于预测复杂关系,模型复杂性更高,适用于大数据集和需要高预测性能的应用。- 科研为国分忧,创新与民造福 -

日更时间紧任务急,难免有疏漏之处,还请大侠海涵 内容仅供学习交流之用,部分素材来自网络,侵联删

[ 算法金,碎碎念 ]

全网同名,日更万日,让更多人享受智能乐趣

如果觉得内容有价值,烦请大侠多多 分享、在看、点赞,助力算法金又猛又持久、很黄很 BL 的日更下去;

同时邀请大侠 关注、星标 算法金,围观日更万日,助你功力大增、笑傲江湖

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/32481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

array_key_exists() expects parameter 2 to be array, null given

公众号获取微信服务器IP地址 错误代码如下 public function getwxIP(){//获取微信服务器IP地址$accessToken $this->getwxoaiAccessToken();$userToken new UserToken();$result $userToken->curl_get("https: //api.weixin.qq.com/cgi-bin/get_api_domain_ip…

Chromium 调试指南2024 - 远程开发(上)

1. 引言 在现代软件开发过程中,远程开发已成为一种流行的工作方式。随着云计算和网络技术的迅猛发展,开发者不再局限于本地环境进行编码、测试和调试,而是可以借助远程服务器强大的计算资源和灵活的配置进行开发工作。远程开发不仅提升了开发…

PyTorch nn.CrossEntropyLoss() 交叉熵损失函数详解和要点提醒

文章目录 前置知识nn.CrossEntropyLoss() 交叉熵损失参数数学公式带权重的公式(weight)标签平滑(label_smoothing) 要点 附录参考链接 前置知识 深度学习:关于损失函数的一些前置知识(PyTorch Loss&#x…

如何在Java中实现高效的文件读写

如何在Java中实现高效的文件读写 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Java开发中,文件读写是一项常见且必不可少的操作。然而&#x…

vue判断是不是最新的请求接口返回的数据

有时候一个页面,我们可能会重复请求同一个接口,但是请求参数不同,如果第一个参数请求接口了,我们又使用第二个参数请求同一个接口了,但是第二个参数请求先返回数据,然后第一个参数才返回数据,这…

Day58 代码随想录打卡|二叉树篇---将有序数组转换为二叉搜索树

题目(leecode T108): 给你一个整数数组 nums ,其中元素已经按 升序 排列,请你将其转换为一棵 平衡 二叉搜索树。 方法:用有序数组构造平衡二叉搜索树,和我们之前有一题的思路差不多&#xff0c…

win11中截屏的快捷方式

在 Windows 11 中,有多种方式可以进行截屏(屏幕截图),这里是一些常用的快捷方式: 全屏截图保存至剪贴板: 按 PrtScn (打印屏幕键)。这会把整个屏幕的截图保存到剪贴板,你…

遗传算法求解时间窗车辆路径规划问题(附python代码)

摘要 本研究提出了一种基于遗传算法的车辆路径规划(VRP)问题求解框架,它能够有效地处理一系列复杂约束,包括软时间窗、硬时间窗、行驶距离限制、车辆最大载重量、多个配送中心的协调、特定的配送顺序,以及多种车型的选…

【总结】攻击 AI 模型的方法

数据投毒 污染训练数据 后门攻击 通过设计隐蔽的触发器,使得模型在正常测试时无异常,而面对触发器样本时被操纵输出。后门攻击可以看作是特殊的数据投毒,但是也可以通过修改模型参数来实现 对抗样本 只对输入做微小的改动,使模型…

Python学习打卡:day13

day13 笔记来源于:黑马程序员python教程,8天python从入门到精通,学python看这套就够了 目录 day1397、初识对象98、类的成员方法类的定义和使用成员变量和成员方法成员方法的定义语法 99、类和对象在程序中通过类来描述基于类创建对象 100、…

Javaweb登录校验

登录校验 JWT令牌的相关操作需要添加相关依赖 <dependency><groupId>io.jsonwebtoken</groupId><artifactId>jjwt</artifactId><version>0.9.1</version> </dependency>一、摘要 场景&#xff1a;当我们想要访问一个网站时&am…

cherry 笔记三(启动)

cherry启动很简单 app创建完 直接startup()就好了 func main() {app : cherry.Configure("./examples/config/profile-chat.json","chat-master",false,cherry.Cluster,)app.SetSerializer(cserializer.NewJSON())app.Startup() } Configure()--->N…

c++使用std::function/std::bind

1&#xff09;C入门级小知识&#xff0c;分享给将要学习或者正在学习C开发的同学。 2&#xff09;内容属于原创&#xff0c;若转载&#xff0c;请说明出处。 3&#xff09;提供相关问题有偿答疑和支持。 std::function对象是对C中现有的可调用实体的一种类型安全的包裹&…

什么是Azure OpenAI?

Azure OpenAI 是微软与 OpenAI 合作推出的人工智能服务&#xff0c;旨在通过 Azure 云平台提供 OpenAI 的先进模型和技术。这个服务允许开发者和企业使用 OpenAI 的强大语言模型&#xff08;如 GPT-3、Codex 和 DALL-E 等&#xff09;来创建智能应用和解决方案。以下是一些主要…

多路h265监控录放开发-(9)通过拖拽到窗口完成渲染

xcamera_widget.h class XCameraWidget :public QWidget {Q_OBJECTpublic:XCameraWidget(QWidget* p nullptr);//渲染视频void Draw();//123//清理资源,再一个窗口被覆盖后 清理之前窗口生成的资源1~XCameraWidget();//123 private:XDecodeTask* decode_ nullptr;//123XDemu…

spring-cloud 开发 - RestTemplate 远程调用 HTTP 接口

现在有这样一个场景&#xff0c;我们要实现一个订单服务和一个商品服务&#xff0c;两个服务程序部署在不同的服务器上&#xff0c;当我们获取订单信息时&#xff0c;订单信息中要包含有商品信息&#xff0c;所以订单服务要向商品服务发送请求获取商品信息&#xff0c;这个流程…

Linux平台I2C多字节数据、按页连续读写E2PROM Demo(AT24C16)

1&#xff09;Linux 平台I2C多字节数据按页连续读写E2PROM之AT24C16小知识&#xff0c;分享给将要学习或者正在学习Linux平台I2C多字节按页连续读写E2PROM开发的同学。 2&#xff09;内容属于原创&#xff0c;若转载&#xff0c;请说明出处。 3&#xff09;提供相关问题有偿答…

class中的溢出滑动效果

效果图&#xff1a; 代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><style>*{margin: 0;padding: 0;}.frame-pages{width: 30%;height: 60px;display: flex;justify…

网络安全-如何设计一个安全的API(安全角度)

目录 API安全概述设计一个安全的API一个基本的API主要代码调用API的一些问题 BasicAuth认证流程主要代码问题 API Key流程主要代码问题 Bearer auth/Token auth流程 Digest Auth流程主要代码问题 JWT Token流程代码问题 Hmac流程主要代码问题 OAuth比较自定义请求签名身份认证&…

测试工程师常见的面试问题及回答建议

说起软件测试近几年的发展&#xff0c;其实已悄无声息地发生了巨大的变化。前几年随着互联网行业的迅猛发展&#xff0c;软件测试人才稀缺&#xff0c;低门槛高薪资促使大批毕业生和转行人员一窝蜂地涌入。而现在&#xff0c;软件测试发展太快&#xff0c;纵观各大招聘网站&…