大数定律与中心极限定理

大数定律与中心极限定理

  • 大数定律
    • 切比雪夫不等式
    • 依概率收敛
    • 切比雪夫大数定律
    • 辛钦大数定律
    • 伯努利大数定律
  • 中心极限定理
    • 列维-林德伯格中心极限定理(Lindeberg-Levy central limit theorem)
    • 棣莫弗-拉普拉斯中心极限定理(De Moivre-Laplace central limit theorem)
    • 李雅普诺夫中心极限定理(Lyapunov’s central limit theorem)

大数定律描述了独立同分布随机变量序列的算术平均值依概率收敛到分布的数学期望;中心极限定理描述了独立同分布随机变量序列之和的分布逼近于正分布。在很多场合中都能见到被冠以“大数定律”和“中心极限定理”的各类结论。

大数定律

在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。

我们知道,大数定律研究的是随机现象统计规律性的一类定理,当我们大量重复某一相同的实验的时候,其最后的实验结果可能会稳定在某一数值附近。就像抛硬币一样,当我们不断地抛,抛个上千次,甚至上万次,我们会发现,正面或者反面向上的次数都会接近一半。除了抛硬币,现实中还有许许多多这样的例子,像掷骰子,最著名的实验就是蒲丰投针实验。这些实验都像我们传达了一个共同的信息,那就是大量重复实验最终的结果都会比较稳定。那稳定性到底是什么?怎样去用数学语言把它表达出来?这其中会不会有某种规律性?是必然的还是偶然的?这一系列问题其实就是大数定律要研究的问题。

切比雪夫不等式

切比雪夫不等式可以对随机变量偏离期望值的概率做出估计,这是大数定律的推理基础。设随机变量X的数学期望E(x)和方差D(x)都存在,则对任意的 ε > 0 \varepsilon>0 ε>0,总有
P ( ∣ X − E ( X ) ∣ ≥ ε ) ≤ D ( x ) ε 2 P(|X-E(X)| \geq \varepsilon) \leq \frac{D(x)}{\varepsilon^2} P(XE(X)ε)ε2D(x)
切比雪夫不等式有时也可写成(由逆概率事件公式):
P ( ∣ X − E ( X ) ∣ < ε ) ≥ 1 − D ( x ) ε 2 P(|X-E(X)| < \varepsilon) \geq 1-\frac{D(x)}{\varepsilon^2} P(XE(X)<ε)1ε2D(x)
证明: 只证明连续随机变量的情形。设X的概率密度为f(x),则有
P ( ∣ X − E ( X ) ∣ ≥ ε ) = ∫ ∣ X − E ( X ) ∣ ≥ ε f ( x ) d x ≤ ∫ ∣ X − E ( X ) ∣ ≥ ε ∣ X − E ( X ) ∣ 2 ε 2 f ( x ) d x ≤ 1 ε 2 ∫ − ∞ ∞ ( X − E ( X ) ) 2 f ( x ) d x ≤ D ( x ) ε 2 \begin{equation}\begin{split} P(|X-E(X)| \geq \varepsilon) &= \int_{|X-E(X)| \geq \varepsilon} f(x)\text{d} x \\ & \leq \int_{|X-E(X)| \geq \varepsilon} \frac{|X-E(X)|^2}{\varepsilon^2} f(x)\text{d} x\\ & \leq \frac{1}{\varepsilon^2}\int_{-\infty}^{\infty} {(X-E(X))^2} f(x)\text{d} x\\ & \leq \frac{D(x)}{\varepsilon^2} \end{split}\end{equation} P(XE(X)ε)=XE(X)εf(x)dxXE(X)εε2XE(X)2f(x)dxε21(XE(X))2f(x)dxε2D(x)

切比雪夫不等式给出了当随机变量的分布未知,只知道数学期望E(x)和方差D(x)时,估计概率 P ( ∣ X − E ( X ) ∣ ≥ ε ) P(|X-E(X)| \geq \varepsilon) P(XE(X)ε)的上界,这个估计是比较粗糙的。

【注】显然,如果已知随机变量的分布,则所求概率 P ( ∣ X − E ( X ) ∣ ≥ ε ) P(|X-E(X)| \geq \varepsilon) P(XE(X)ε)可以明确地计算出来,也就没必要用切比雪夫不等式估计了,切比雪夫不等式只适用于分布未知的情形。

依概率收敛

X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn是一个随机变量序列(一系列随机变量),A是一个常数,如果对任意的 ε > 0 ε>0 ε>0,有
lim ⁡ n → ∞ P ( ∣ X n − A ∣ < ε ) = 1 \lim_{n \rightarrow \infty} P(|X_n-A| < \varepsilon )= 1 nlimP(XnA<ε)=1
则称随机变量序列 X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn依概率收敛于常数A,也记作 X n → P A X_n {\rightarrow}^{P} A XnPA

切比雪夫大数定律

X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn是一个两两不相关的随机变量序列(相互独立),存在常熟 C C C,使 D ( X i ) ≤ C D(X_i)\leq C D(Xi)C,则对任意的 ε > 0 \varepsilon > 0 ε>0
lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ ≤ ε ) = 1 \lim_{n \rightarrow \infty} P \left( |\frac{1}{n} \sum_{i=1}^nX_i-\frac{1}{n} \sum_{i=1}^n E(X_i)| \leq \varepsilon\right) = 1 nlimP(n1i=1nXin1i=1nE(Xi)ε)=1

将该公式应用于抽样调查,就会有如下结论:随着样本容量 n n n的增加,样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。

特别需要注意的是,切比雪夫大数定理并未要求 X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn同分布,相较于伯努利大数定律和辛钦大数定律更具一般性。

辛钦大数定律

X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn独立同分布的随机变量序列,具有数学期望 E X i = μ \mathbb{E} X_i= \mu EXi=μ,则对任意的 ε > 0 \varepsilon > 0 ε>0
lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − μ ∣ ≤ ε ) = 1 \lim_{n \rightarrow \infty} P \left( |\frac{1}{n} \sum_{i=1}^nX_i-\mu| \leq \varepsilon\right) = 1 nlimP(n1i=1nXiμε)=1

伯努利大数定律

n n n重伯努利试验:

  1. 实验结果只有 A A A A ˉ \bar A Aˉ两种结果
  2. 每次试验 A A A发生的概率 P ( A ) P(A) P(A)保持不变
  3. 试验独立重复进行 n n n

伯努利大数定律是辛钦大数定律的一个重要推论,设随机变量 X n ∼ B ( n , p ) X_n \sim B(n,p) XnB(n,p),则对任意的 ε > 0 \varepsilon>0 ε>0有:
lim ⁡ n → ∞ P ( ∣ X n n − p ∣ < ε ) = 1 \lim_{n \rightarrow \infty} P\left( | \frac{X_n}{n}-p| < \varepsilon\right)=1 nlimP(nXnp<ε)=1
二项分布 X n ∼ B ( n , p ) X_n \sim B(n,p) XnB(n,p)可以写成n个独立的符合0-1分布 B ( 1 , p ) B(1,p) B(1,p)的随机变量之和,即 X n = Y 1 + Y 2 + ⋯ + Y n X_n=Y_1+Y_2+\cdots+Y_n Xn=Y1+Y2++Yn,其中 Y 1 , Y 2 , ⋯ , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn独立同分布, Y i ∼ B ( 1 , p ) Y_i \sim B(1,p) YiB(1,p),又 E Y i = p EY_i=p EYi=p,则由辛钦大数定律可得
lim ⁡ n → ∞ P ( ∣ 1 n ∑ i = 1 n Y i − p ∣ < ε ) = lim ⁡ n → ∞ P ( ∣ X n n − p ∣ < ε ) = 1 \lim_{n \rightarrow \infty} P\left( | \frac{1}{n}\sum_{i=1}^nY_i-p| < \varepsilon\right)= \lim_{n \rightarrow \infty} P\left( | \frac{X_n}{n}-p| < \varepsilon\right)=1 nlimP(n1i=1nYip<ε)=nlimP(nXnp<ε)=1
伯努利大数定律表明,只要试验次数足够多,事件 { ∣ X n n − p ∣ < ε } \{|\frac{X_n}{n}-p| < \varepsilon \} {nXnp<ε}是一个小概率事件,而小概率事件在实际中是几乎不发生的,这就是频率稳定性的真正含义。在实际应用中,当试验次数很大时,就可以用事件的频率来代替事件的概率。

中心极限定理

大数定律研究的是一系列随机变量 X n {X_n} Xn的均值 X ˉ n = 1 n ∑ i = 1 n X i \bar X_n=\frac{1}{n}\sum_{i=1}^nX_i Xˉn=n1i=1nXi是否会依概率收敛于其期望 E X ˉ n \mathbb{E} \bar X_n EXˉn这个数值,而中心极限定理进一步研究 X ˉ n \bar X_n Xˉn服从什么分布。若 X n {X_n} Xn满足一定的条件,当n足够大时, X ˉ n \bar X_n Xˉn近似服从正态分布,这就是中心极限定理的主要思想,这也体现了正态分布的要与普遍性。

在客观实际中有很多随机变量,它们是由大量的相互独立的随机因素综合作用而成,其中每个因素在总的影响中所起的作用都是微小的,这种随机变量往往近似地服从正态分布。此现象就是中心极限定理的客观背景。

列维-林德伯格中心极限定理(Lindeberg-Levy central limit theorem)

X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn独立同分布,存在数学期望 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ和方差 D ( X i ) = σ 2 D(X_i)=\sigma^2 D(Xi)=σ2,则对于任意实数,有
lim ⁡ n → ∞ P ( ∑ i = 1 n X i − n μ n σ ≤ x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t = Φ ( x ) \lim_{n \rightarrow \infty }P \left( \frac{\sum_{i=1}^n X_i -n\mu}{\sqrt n \sigma} \leq x\right) = \frac{1}{\sqrt {2\pi}} \int_{-\infty}^xe^{-\frac{t^2}{2} \text{d} t}=\Phi(x) nlimP(n σi=1nXinμx)=2π 1xe2t2dt=Φ(x)
中心极限定理表明,当n充分大时, ∑ i = 1 n X i \sum_{i=1}^n X_i i=1nXi的标准化 ∑ i = 1 n X i − n μ n σ \frac{\sum_{i=1}^n X_i -n\mu}{\sqrt n \sigma} n σi=1nXinμ近似服从正态分布 N ( 0 , 1 ) N(0,1) N(0,1),或者说 ∑ i = 1 n X i \sum_{i=1}^n X_i i=1nXi近似服从 N ( n μ , n σ 2 ) N(n\mu,n\sigma^2) N(nμ,nσ2),即
P ( a < ∑ i = 1 n X i < b ) ≈ Φ ( b − n μ n σ ) − Φ ( a − n μ n σ ) P(a < \sum_{i=1}^n X_i <b) \approx \Phi( \frac{b-n\mu}{\sqrt n \sigma}) - \Phi( \frac{a-n\mu}{\sqrt n \sigma}) P(a<i=1nXi<b)Φ(n σbnμ)Φ(n σanμ)

中心极限定理是数理统计中大样本统计推断的基础。注意,定理中独立同分布、数学期望存在、方差存在三者缺一不可。只要问题涉及独立同分布随机变量的和 ∑ i = 1 n X i \sum_{i=1}^n X_i i=1nXi,就可以考虑使用中心极限定理。

棣莫弗-拉普拉斯中心极限定理(De Moivre-Laplace central limit theorem)

棣莫弗-拉普拉斯中心极限定理是列维-林德伯格中心极限定理的重要推论。1733年,棣莫弗-拉普拉斯经过推理证明,得出了二项分布的极限分布是正态分布的结论,后来他又在原来的基础上做了改进,证明了不止二项分布满足这个条件,其他任何分布都是可以的,为中心极限定理的发展做出了伟大的贡献。

设随机变量 X n ∼ B ( n , p ) X_n \sim B(n,p) XnB(n,p),则对任意的实数 x > 0 x>0 x>0
lim ⁡ n → ∞ P ( X n − n p n p ( 1 − p ) ≤ x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t = Φ ( x ) \lim_{n \rightarrow \infty}P \left( \frac{X_n-np}{\sqrt{np(1-p)} } \leq x\right) = \frac{1}{\sqrt {2\pi}} \int_{-\infty}^xe^{-\frac{t^2}{2} \text{d} t}=\Phi(x) nlimP(np(1p) Xnnpx)=2π 1xe2t2dt=Φ(x)
证明: 二项分布 X n ∼ B ( n , p ) X_n \sim B(n,p) XnB(n,p)可以写成n个独立的符合0-1分布 B ( 1 , p ) B(1,p) B(1,p)的随机变量之和,即 X n = Y 1 + Y 2 + ⋯ + Y n X_n=Y_1+Y_2+\cdots+Y_n Xn=Y1+Y2++Yn,其中 Y 1 , Y 2 , ⋯ , Y n Y_1,Y_2,\cdots,Y_n Y1,Y2,,Yn独立同分布, Y i ∼ B ( 1 , p ) Y_i \sim B(1,p) YiB(1,p),又 E Y i = p \text EY_i=p EYi=p D Y i = p ( 1 − p ) \text DY_i=p(1-p) DYi=p(1p),则由列维-林德伯格中心极限定理可得
lim ⁡ n → ∞ P ( ∑ i = 1 n Y i − n p n p ( 1 − p ) ≤ x ) = lim ⁡ n → ∞ P ( X n − n p n p ( 1 − p ) ≤ x ) = Φ ( x ) \lim_{n \rightarrow \infty}P \left( \frac{\sum_{i=1}^n Y_i-np}{\sqrt{np(1-p)}} \leq x\right) = \lim_{n \rightarrow \infty}P\left( \frac{X_n-np}{\sqrt{np(1-p)}} \leq x\right)=\Phi(x) nlimP(np(1p) i=1nYinpx)=nlimP(np(1p) Xnnpx)=Φ(x)
中心极限定理表明,当n充分大时, B ( n , p ) B(n,p) B(n,p)的随机变量 X n X_n Xn的标准化 X n − n p n p ( 1 − p ) \frac{X_n-np}{\sqrt{np(1-p)}} np(1p) Xnnp近似服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),或者说 X n X_n Xn近似服从 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N(np,np(1p))
P ( a < X n < b ) ≈ Φ ( b − n p n p ( 1 − p ) ) − Φ ( a − n p n p ( 1 − p ) ) P(a <X_n <b) \approx \Phi( \frac{b-np}{\sqrt {np(1-p)} }) - \Phi( \frac{a-np}{\sqrt {np(1-p)}}) P(a<Xn<b)Φ(np(1p) bnp)Φ(np(1p) anp)
在这之后大数定律的发展出现了停滞。直到20世纪,李雅普诺夫又在拉普拉斯定理的基础上做了自己的创新,他得出了特征函数法,将大数定律的研究延伸到函数层面,这对中心极限定理的发展有着重要的意义。到1920年,数学家们开始探讨中心极限定理在什么条件下普遍成立,这才有了后来发表的林德伯格条件和费勒条件,这些成果对中心极限定理的发展都功不可没。

李雅普诺夫中心极限定理(Lyapunov’s central limit theorem)

the sum of multiple independent
random variables follows a normal distribution
X 1 , X 2 , X 1 , ⋯ , X n X_1, X_2, X_1, \cdots, X_n X1,X2,X1,,Xn相互独立,存在数学期望 E ( X i ) = μ i E(X_i)=\mu_i E(Xi)=μi和方差 D ( X i ) = σ i 2 D(X_i)=\sigma_i^2 D(Xi)=σi2,则随机变量服从正态分布。

参考:

  • 中心极限定理——概率论中最重要的结论之一
  • 大数定律与中心极限定理
  • 概率论复习笔记五——大数定律和中心极限定理
  • 大数定律和中心极限定理(清华)
  • 大数定律和中心极限定理(中国科学技术大学)
  • https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E5%AE%9A%E5%BE%8B/410082
  • https://zhuanlan.zhihu.com/p/77312635
  • https://blog.csdn.net/SpiritedAway1106/article/details/107954388
  • https://blog.csdn.net/weixin_43287568/article/details/113596881
  • https://www.zhihu.com/question/26854682

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/765648.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【运放】LM358和LM324

&#x1f6a9; WRITE IN FRONT &#x1f6a9; &#x1f50e; 介绍&#xff1a;"謓泽"正在路上朝着"攻城狮"方向"前进四" &#x1f50e;&#x1f3c5; 荣誉&#xff1a;2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评…

python脚本for循环

使用python脚本单个输出Hello单词。 for循环实例&#xff1a; ​ [rootkvm-72 py]# cat for02.py #for i in hello: #for i in "hello": #for i in hello: for i in """hello""":print("i ", i)​ 单个字符输出结果&…

C语言运算符优先级

C语言运算符的优先级&#xff08;从高到低&#xff09;如下所示&#xff1a; 1. ()&#xff1a;括号 2. []&#xff1a;数组索引 3. . 和 ->&#xff1a;结构体和联合体成员选择 4. 和 --&#xff1a;自增和自减 5. !&#xff1a;逻辑非 6. ~&#xff1a;位取反 7. -&…

力扣---打家劫舍---动态规划

思路 1&#xff1a; 我将res[i]定义为&#xff1a;一定要取第 i 个房子的前提下&#xff0c;能获取的最大金额。那么直接用cnt从头记录到尾&#xff0c;每个房子的res最大值即是答案。那么递推公式是什么&#xff1f;res[i]max(res[i-2],res[i-1],...,res[0])nums[i]。数组初始…

如何配置nginx反向代理服务器

配置Nginx作为反向代理服务&#xff0c;你需要编辑Nginx的配置文件&#xff08;通常是nginx.conf或在其下的某个sites-available目录下的特定域名配置文件&#xff09;&#xff0c;并在其中添加反向代理相关配置块。以下是一个基本的反向代理配置示例&#xff1a; # 假设这是位…

mysql中的数据类型大全纯干货------------时间日期类型

简介(类型预览): 在mysql8.0版本中支持的类型主要有: YEAR类型表示年 DATE类型表示年,月,日 TIME类型表示时,分,秒 DATETIME类型表示年,月,日,时,分,秒 TIMESTAMP类型通常表示带时区的年,月,日,时,分,秒 数据类型单位占用字节格式下限上限YEAR年1YYY或…

C# StableDiffusion StableDiffusionSharp 脱离python臃肿的环境

目录 说明 效果 项目 代码 下载 C# StableDiffusion StableDiffusionSharp 脱离python臃肿的环境 说明 Stable Diffusion in pure C/C github地址&#xff1a;https://github.com/leejet/stable-diffusion.cpp C# Wrapper for StableDiffusion.cpp github地址&#x…

Java的三大特性之一——继承

前言 http://t.csdnimg.cn/uibg3 在上一篇中我们已经讲解过封装&#xff0c;这里就主要讲解继承与多态 继承 1.为什么需要继承 Java中使用类对现实世界中实体来进行描述&#xff0c;类经过实例化之后的产物对象&#xff0c;则可以用来表示现实中的实体&#xff0c;但是现实…

zabbix6.4监控mysql数据库

目录 一、前提二、配置mysql数据库模板三、配置监控的mysql主机 一、前提 已经搭建好zabbix-server 在需要监控的mysql服务器上安装zabbix-agent2 上述安装步骤参考我的上篇文章&#xff1a;通过docker容器安装zabbix6.4.12图文详解&#xff08;监控服务器docker容器&#xf…

RAII 与智能指针

1.什么是 RAII 1.概念 Resource Acquisition Is Initialization 资源获取即初始化。一般分为 3 步&#xff0c;当我们在main函数中声明一个局部对象的时候&#xff0c;会自动调用构造函数进行对象的初始化&#xff0c;当整个main函数执行完成后&#xff0c;自动调用析构函数来…

用Compute Shader处理图像数据后在安卓机上不能正常显示渲染纹理

1&#xff09;用Compute Shader处理图像数据后在安卓机上不能正常显示渲染纹理 2&#xff09;折叠屏适配问题 3&#xff09;Prefab对DLL中脚本的引用丢失 4&#xff09;如何优化Unity VolumeManager中的ReplaceData 这是第378篇UWA技术知识分享的推送&#xff0c;精选了UWA社区…

css的box-shadow详解

CSS的box-shadow属性用于在元素框上添加阴影效果。它可以为元素提供外阴影或内阴影&#xff0c;并且可以控制阴影的颜色、偏移距离、模糊半径以及扩展半径。 box-shadow属性的基本语法如下&#xff1a; box-shadow: h-shadow v-shadow blur spread color inset;下面是各个参数…

超快的 AI 实时语音转文字,比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper

faster-whisper 这个项目是基于 OpenAI whisper 的模型&#xff0c;在上面的一个重写。 使用的是 CTranslate2 的这样的一个库&#xff0c;CTranslate2 是用于 Transformer 模型的一个快速推理引擎。 在相同精度的情况下&#xff0c;faster-whisper 的速度比 OpenAI whisper …

web开发必备之跨域

1.什么是跨域&#xff1f; 当一个请求url的协议、域名、端口三者之间任意一个与当前页面url不同即为跨域 举个例子或许比较生动 当前所在页面请求的页面是否同域原因https://www.csdn.net/https://blog.csdn.net/weixin_56703682√同源&#xff08;同域名同协议同端口&#x…

【网站项目】294火车票订票系统

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

EI Scopus双检索| 2024年智能交通与未来出行国际会议(CSTFM 2024)

会议简介 Brief Introduction 2024年智能交通与未来出行国际会议(CSTFM 2024) 会议时间&#xff1a;2024年10月18日-20日 召开地点&#xff1a;中国杭州 大会官网&#xff1a;CSTFM 2024-2024 International Conference on Smart Transportation and Future Mobility(CSTFM 202…

解决修改数据后,前端页面不显示问题

如图&#xff0c;修改数据后&#xff0c;在前端页面不显示的问题&#xff0c;可能是因为缓存问题 解决方案 以为Edge浏览器为例 打开设置左边栏点击隐私&#xff0c;搜索和服务选择清除 Internet Explorer 的浏览数据点击删除&#xff0c;重新启动前端界面即可。

大数据专家3个月自学计划

本人有6年Java开发经验&#xff0c;目前在岗中&#xff0c;之前通过视频教学自学过Hadoop生态技术、flume、kafka、Redis、hive、spark、flink、sqoop、azkaban、ozie、habse、presto、kylin等大数据相关技术&#xff0c;希望利用3个月时间复习&#xff0c;成为大数据专家。以下…

3.18作业

一、网络属性&#xff08;getsockopt、setsockopt&#xff09; 1> 由于在网络通信过程中&#xff0c;套接字是服务于各个层的&#xff0c;但是&#xff0c;每一层中对套接字选项都有一定的权限控制&#xff0c;例如&#xff0c;应用层中对端口号快速重用的限制 2> 如何…

日志收集监控告警平台的选型思考

目前市面上比较常见的日志收集系统有&#xff1a;ELK&#xff0c;Grafana Loki&#xff0c;OpenObserve&#xff0c;SigNoz&#xff0c;Graylog &#xff0c;Syslog-ng&#xff0c;Highlight&#xff0c;接下来我会对这几个一一做分析。 1. ELK ELK 是 Elasticsearch、Logsta…