【机器学习】必会数学知识:一文掌握数据科学核心数学知识点(上),值得收藏~

核心数学知识点

  • 1、引言
  • 2、数据科学必会数学知识
    • 2.1 线性代数
    • 2.2 微积分
    • 2.3 概率论
    • 2.4 数理统计
    • 2.5 随机过程
    • 2.6 数据分布
    • 2.7 贝叶斯统计
    • 2.8 线性回归
    • 2.9 逻辑回归
    • 2.10 矩阵分解
    • 2.11 主成分分析(PCA)
    • 2.12 奇异值分解(SVD)
  • 3、总结

1、引言

小屌丝:鱼哥,能不能讲一讲数学知识点啊。
小鱼:这,跟着每一章内容学习就好了
小屌丝:觉得麻烦,你就给总结一下呗。
小鱼:.额… 这真是不拿我当外人啊。
小屌丝:自家人,何必见外。
小鱼:…
在这里插入图片描述

2、数据科学必会数学知识

2.1 线性代数

  • 定义:研究向量、矩阵及其操作的数学分支。
  • 核心原理:向量与矩阵乘法、线性变换、特征值和特征向量等。
  • 用法:数据表示、矩阵分解、降维。
  • 算法公式:矩阵-向量乘法 A x = b A \mathbf{x} = \mathbf{b} Ax=b
  • 代码示例
import numpy as np
A = np.array([[1, 2], [3, 4]])
x = np.array([1, 2])
b = np.dot(A, x)

2.2 微积分

  • 定义:研究变化率(微分)和累积量(积分)的数学分支。
  • 核心原理:导数、积分、梯度、链式法则。
  • 用法:优化算法(如梯度下降)、曲线拟合。
  • 算法公式:梯度 ∇ f ( x ) \nabla f(x) f(x)
  • 代码示例
import sympy as sp
x = sp.Symbol('x')
f = x**2
f_prime = sp.diff(f, x)

2.3 概率论

  • 定义:研究随机事件发生概率及其分布规律的数学分支。
  • 核心原理:概率空间、条件概率、贝叶斯定理。
  • 用法:机器学习模型中的概率估计、潜在变量模型。
  • 算法公式:贝叶斯公式 P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)
  • 代码示例
from scipy.stats import normp = norm.pdf(0)  # 标准正态分布在0点处的概率密度值

2.4 数理统计

  • 定义:利用概率分布对数据进行推断和验证的数学分支。
  • 核心原理:假设检验、置信区间、最大似然估计(MLE)。
  • 用法:统计模型的参数估计、验证模型。
  • 算法公式:t-检验公式 t = x ˉ − μ 0 s / n t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} t=s/n xˉμ0
  • 代码示例
from scipy import stats
t_stat, p_value = stats.ttest_1samp([1, 2, 3, 4, 5], 3)

2.5 随机过程

  • 定义:研究随时间或空间随机变量变化的数学模型。
  • 核心原理:马尔可夫链、泊松过程、随机游走。
  • 用法:时间序列分析、金融建模。
  • 算法公式:马尔可夫链状态转移概率 P ( X n + 1 = j ∣ X n = i ) P(X_{n+1}=j|X_n=i) P(Xn+1=jXn=i)
  • 代码示例
import numpy as np
# 简单的马尔可夫链模拟
transition_matrix = np.array([[0.5, 0.5], [0.2, 0.8]])
initial_state = np.array([0.8, 0.2])
next_state = np.dot(initial_state, transition_matrix)

2.6 数据分布

  • 定义:研究数据如何在数值范围内分布的数学特征。
  • 核心原理:正态分布、泊松分布、指数分布等。
  • 用法:数据建模、异常检测。
  • 算法公式: 正态分布概率密度函数 f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=2π σ1e2σ2(xμ)2
  • 代码示例
import numpy as np
import matplotlib.pyplot as plt
mean, std_dev = 0, 1
samples = np.random.normal(mean, std_dev, 1000)
plt.hist(samples, bins=30, density=True)
plt.show()

2.7 贝叶斯统计

  • 定义:一种基于贝叶斯定理的统计推断方法。
  • 核心原理:先验分布、后验分布、贝叶斯更新。
  • 用法:贝叶斯网络、贝叶斯优化。
  • 算法公式:后验概率 P ( θ ∣ X ) = P ( X ∣ θ ) P ( θ ) P ( X ) P(\theta|X) = \frac{P(X|\theta)P(\theta)}{P(X)} P(θX)=P(X)P(Xθ)P(θ)
  • 代码示例
import pymc3 as pm
# 使用PyMC3进行贝叶斯推断
with pm.Model() as model:theta = pm.Uniform('theta', lower=0, upper=1)y = pm.Bernoulli('y', p=theta, observed=[1, 0, 0, 1, 1])trace = pm.sample(1000, step=pm.Metropolis())
pm.traceplot(trace)

2.8 线性回归

  • 定义:用线性模型描述自变量和因变量关系的统计方法。

  • 核心原理:最小二乘法、回归系数估计。

  • 用法:趋势预测、关系探索。

  • 算法公式 y = β 0 + β 1 x + ε y = \beta_0 + \beta_1 x + \varepsilon y=β0+β1x+ε

  • 代码示例

from sklearn.linear_model import LinearRegressionX = [[1], [2], [3], [4]]
y = [2, 3, 5, 7]
model = LinearRegression().fit(X, y)

2.9 逻辑回归

  • 定义:用于分类问题的回归模型。
  • 核心原理:逻辑函数映射概率、最大似然估计。
  • 用法:二元分类、多分类。
  • 算法公式 P ( y = 1 ∣ x ) = 1 1 + e − ( β 0 + β 1 x ) P(y=1|x) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 x)}} P(y=1∣x)=1+e(β0+β1x)1
  • 代码示例
from sklearn.linear_model import LogisticRegressionX = [[0], [1], [2], [3]]
y = [0, 0, 1, 1]
model = LogisticRegression().fit(X, y)

2.10 矩阵分解

  • 定义:将矩阵分解成多个矩阵乘积的技术。
  • 核心原理:特征分解、奇异值分解(SVD)。
  • 用法:降维、推荐系统。
  • 算法公式 A = U Σ V T A = U \Sigma V^T A=UΣVT
  • 代码示例
import numpy as npA = np.array([[3, 1], [1, 3]])
U, Sigma, Vt = np.linalg.svd(A)

2.11 主成分分析(PCA)

  • 定义:一种降维技术,通过线性变换将数据投影到较低维度空间。
  • 核心原理:协方差矩阵、特征值和特征向量。
  • 用法:降维、数据压缩。
  • 算法公式 Z = X W \mathbf{Z} = \mathbf{XW} Z=XW
  • 代码示例
from sklearn.decomposition import PCAX = [[1, 2], [3, 4], [5, 6]]
pca = PCA(n_components=1)
principal_components = pca.fit_transform(X)

2.12 奇异值分解(SVD)

  • 定义:一种矩阵分解方法,将矩阵分解为三个子矩阵的乘积。
  • 核心原理:特征分解、秩、范数。
  • 用法:降维、信号处理。
  • 算法公式 A = U Σ V T A = U \Sigma V^T A=UΣVT
  • 代码示例
import numpy as npA = np.array([[3, 1], [1, 3]])
U, Sigma, Vt = np.linalg.svd(A)

3、总结

由于临时任务,今天的内容就先写到这里了。
关于另一部分数学知识点,小鱼会在这篇体现哦

  • 【机器学习】必会数学知识:一文掌握数据科学核心数学知识点(上),收藏~

  • 【机器学习】必会数学知识:一文掌握数据科学核心数学知识点(下),收藏~
    我是小鱼

  • CSDN 博客专家

  • 阿里云 专家博主

  • 51CTO博客专家

  • 企业认证金牌面试官

  • 多个名企认证&特邀讲师等

  • 名企签约职场面试培训、职场规划师

  • 多个国内主流技术社区的认证专家博主

  • 多款主流产品(阿里云等)评测一等奖获得者

关注小鱼,学习【机器学习】&【深度学习】领域的知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/43008.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【人工智能大语言模型技术发展研究报告 2024】

文末‍有福利! 人工智能作为引领新一轮科技产业革命的战略性技术和新质生产力重要驱动力,正在引发经济、社会、文化等领域的变革和重塑,2023 年以来,以 ChatGPT、GPT-4 为代表的大模型技术的出台,因其强大的内容生成及…

提升教师健康,聚焦智慧校园人事系统的职工体检功能

智慧校园人事管理系统内置的职工体检管理,是专为教职员工设计的一项健康管理创新实践,巧妙融合先进信息技术,致力于为教职工提供更加便捷、易懂且持续性的健康检查与管理支持。该服务从多个维度出发,全面呵护教职工的身心健康。 该…

给你的博客加上评论区

一个网站如果有评论功能,可以更好的和读者互动。VuePress 也有很多评论插件,这里简单介绍下,最后介绍本站所使用的 Twikoo。 大部分评论插件都是使用的 Github 或 Gitee 的 issue 功能,也就是用 issue 去存储评论;而 …

脚本实现保留文本中特定字符之后的字符串

#目的背景 原始txt文本如下图 目的是为了去除序号,每行只单独呈现域名 手工删除漫长又麻烦,使用脚本快捷些 代码实现逻辑: 1.使用open函数打开文本,之后用变量lines存储文本的所有行,使用for循环,让变量te…

暑假学习计划怎么做 用待办计划软件安排更科学

暑期来临,无论是学生还是老师,做好暑期计划都至关重要。记得去年暑假,我给自己定下了阅读十本书的目标,却因为缺乏明确的计划,最后只草草读完了两本。而今年,我决定尝试一种新的方式——使用待办计划软件来…

谷粒商城实战笔记-24-分布式组件-SpringCloud Alibaba-Nacos配置中心-命名空间与配置分组

文章目录 一,命名空间1,简介1.1,命名空间的主要功能和特点1.2,使用场景1.3,如何指定命名空间 2,命名空间实战2.1,环境隔离2.2,服务隔离 二,配置集三,配置集ID…

js原型和类---prototype,__proto__,new,class

原型和原型链 在js中,所有的变量都有原型,原型也可以有原型,原型最终都指向Object 什么是原型 在js中,一个变量被创建出来,它就会被绑定一个原型;比如说,任何一个变量都可以使用console.log打…

PostgreSQL 中如何实现数据的增量更新和全量更新的平衡?

文章目录 一、增量更新与全量更新的概念增量更新全量更新 二、考虑的因素1. 数据量2. 数据更改的频率和规模3. 数据一致性要求4. 系统性能和资源利用5. 业务逻辑和流程 三、解决方案(一)混合使用增量更新和全量更新(二)使用临时表…

暑期旅游季必备,用这款客服神器应对爆棚的客流咨询

解决暑期旅游客流高峰问题 暑期是旅游高峰季节,客流量剧增,客户咨询纷至沓来。在这个时候,如何高效处理客户的咨询成为每家旅游机构和景点不可忽视的挑战。 聊天宝快捷回复助手是一款强大的工具,可帮助企业在客流高峰期快速回复客…

MemFire Cloud: 一种全新定义后端即服务的解决方案

在这个快节奏的互联网时代,开发者们最希望的就是能够省时省力地完成项目,快速上线。然而,搭建服务、开发接口API、处理各种后端问题,往往让人头疼不已。别担心,现在有了MemFire Cloud,一款为懒人开发者量身…

制作电子名片的小程序系统源码 快速生成电子名片

在当今数字化时代,传统的纸质名片已逐渐被智能电子名片所取代。电子名片小程序作为一种基于微信生态的创新名片交换方式,凭借其便捷性、高效性和环保性,成为了众多商务人士的首选。小编分享一个制作电子名片的小程序系统源码,无忧…

malloc实现原理【Liunx】

malloc实现原理 malloc是什么?malloc,calloc, realloc的区别malloc的实现原理malloc的两种实现方式为什么使用brk?为什么使用mmap? malloc怎么定界的malloc分配的是虚拟内存上的空间吗? malloc是什么? 通过malloc&…

LinK3D: Linear Keypoints Representation for 3D LiDAR Point Cloud【翻译与解读】

LinK3D: Linear Keypoints Representation for 3D LiDAR Point Cloud 摘要 特征提取和匹配是许多机器人视觉任务的基本组成部分,如 2D 或 3D 目标检测、识别和配准。2D 特征提取和匹配已取得巨大成功。然而,在 3D 领域,当前方法由于描述性差…

2024前端面试题之Vue3

2024前端面试题之Vue3 在面试具有五年经验的前端工程师时,对于 Vue 3 的掌握程度是一个重要的考核点。本文将提供一系列针对这一级别工程师的 Vue 3 面试题,并附上详细的解析,帮助面试官全面评估候选人的技术实力和项目经验。 一、Vue 3 基础…

vscode-server安装和部分配置

文章目录 前言code-server安装rpm包安装tar.gz安装 vscode部分配置vscode配置函数跳转安装插件 vscode的structurevscode的hierarchy更改颜色主题 前言 vscode确实彳亍,虽然我觉得Clion(c/c语言版的IDEA)更方便,但是毕竟我没钱买license 这里记录一下网…

11410-00SF 同轴连接器

型号简介 11410-00SF是Southwest Microwave的连接器。该连接器的外壳采用优质不锈钢,材质为 CRES ALLOY UNS-S303500,符合 ASTM-A582 标准。首先,不锈钢材料经过锻造加工,形成转接器的基本形状。然后,外壳进行精密的 C…

CentOS7忘记root密码无法登陆解决方法

重启服务器,等到如图下所示界面的时候,快速按下键盘的↑或者↓按键,等固定住画面,然后按下e按键 然后按键盘上的↓按键,找到图下所示的linux16开头的那段,然后把光标挪到ro这里 按照图下所示,把…

提供跨平台的视觉安防解决方案,满足不同场景的需求的智慧交通开源了。

智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上…

大气热力学(6)——位温和假相当位温

本篇文章源自我在 2021 年暑假自学大气物理相关知识时手写的笔记,现转化为电子版本以作存档。相较于手写笔记,电子版的部分内容有补充和修改。笔记内容大部分为公式的推导过程。 文章目录 6.1 位温6.2 斜 T-lnP 图(Skew T-lnP)6.2…

第二课使用域名dns ping通www.baidu.com

需要一台dns服务器,实现域名解析,把对应的网址变为Ip地址。 首先按照之前博客的配置,自动分配给PC1和PC2的IP地址等相关配置。 然后增加一台server交换机连接到交换机上,配置好ip地址,192.168.1.100。在dnsServer中。…