随机矩阵投影长度保持引理及其证明

原论文中的引理 2 \textbf{2} 2

1. \textbf{1. } 1. 引理 1 \textbf{1} 1(前提之一)

1.1. \textbf{1.1. } 1.1. 引理 1 \textbf{1} 1的内容

👉前提: X ∼ N ( 0 , σ ) X\sim{}N(0,\sigma) XN(0,σ) f ( x ) = 1 2 π σ e – x 2 2 σ 2 f(x)\text{=}\cfrac{1}{\sqrt{2\pi}\sigma}e^{–\frac{x^{2}}{2\sigma^{2}}} f(x)=2π σ1e2σ2x2,且 ∀ α < 1 2 σ 2 \forall{}\alpha{}\text{<}\cfrac{1}{2\sigma^{2}} α<2σ21

👉结论: E [ e α X 2 ] = 1 1 – 2 α σ 2 \mathrm{E}\left[e^{\alpha{}X^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}} E[eαX2]=1–2ασ2 1

2. \textbf{2. } 2. 引理 1 \textbf{1} 1的证明

E [ e α X 2 ] = ∫ – ∞ ∞ e α x 2 f ( x ) d x = ∫ – ∞ ∞ e α x 2 ⋅ 1 2 π σ e – x 2 2 σ 2 d x = ∫ – ∞ ∞ 1 2 π σ e – x 2 2 σ 2 ( 1 – 2 α σ 2 ) d x \displaystyle{}\mathrm{E}\left[e^{\alpha{}X^2}\right]\text{=}\int_{–\infty}^{\infty}e^{\alpha{}x^2}f(x)dx\text{=}\int_{–\infty}^{\infty} e^{\alpha x^2} \cdot \frac{1}{\sqrt{2 \pi} \sigma} e^{–\frac{x^2}{2 \sigma^2}} d x\text{=}\int_{–\infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{–\frac{x^2}{2 \sigma^2}\left(1–2 \alpha \sigma^2\right)} d x E[eαX2]=–∞eαx2f(x)dx=–∞eαx22π σ1e2σ2x2dx=–∞2π σ1e2σ2x2(1–2ασ2)dx

↪令 σ ′ = σ 1 – 2 α σ 2 \sigma^{\prime}=\cfrac{\sigma}{\sqrt{1–2 \alpha \sigma^2}} σ=1–2ασ2 σ,其中必定要求 1 – 2 α σ 2 >0 1–2 \alpha \sigma^2\text{>0} 1–2ασ2>0 α < 1 2 σ 2 \alpha{}\text{<}\cfrac{1}{2\sigma^{2}} α<2σ21

E [ e α X 2 ] = ∫ – ∞ ∞ 1 – 2 α σ 2 2 π σ 1 – 2 α σ 2 e – x 2 2 σ 2 ( 1 – 2 α σ 2 ) d x = 1 1 – 2 α σ 2 ∫ − ∞ ∞ 1 2 π σ ′ e − x 2 2 σ ′ 2 d x \displaystyle{}\mathrm{E}\left[e^{\alpha X^2}\right]\text{=}\int_{–\infty}^{\infty} \cfrac{\sqrt{1–2 \alpha \sigma^2}}{\sqrt{2 \pi} \sigma \sqrt{1–2 \alpha \sigma^2}} e^{–\frac{x^2}{2 \sigma^2}\left(1–2 \alpha \sigma^2\right)} d x\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}}\int_{-\infty}^{\infty} \cfrac{1}{\sqrt{2 \pi} \sigma^{\prime}} e^{-\frac{x^2}{2 \sigma^{\prime 2}}} d x E[eαX2]=–∞2π σ1–2ασ2 1–2ασ2 e2σ2x2(1–2ασ2)dx=1–2ασ2 12π σ1e2σ′2x2dx

↪考虑到 ∫ − ∞ ∞ 1 2 π σ ′ e − x 2 2 σ ′ 2 d x = 1 \displaystyle{}\int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma^{\prime}} e^{-\frac{x^2}{2 \sigma^{\prime 2}}} d x\text{=}1 2π σ1e2σ′2x2dx=1,所以 E [ e α X 2 ] = 1 1 – 2 α σ 2 \mathrm{E}\left[e^{\alpha{}X^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}} E[eαX2]=1–2ασ2 1

2. \textbf{2. } 2. 引理 2 \textbf{2} 2

2.1. \textbf{2.1. } 2.1. 引理 2 \textbf{2} 2的内容

👉前提 1 1 1:设一个随机矩阵 S = ( s i j ) ∈ R t × d S\text{=}(s_{ij})\text{∈}\mathbb{R}^{t\text{×}d} S=(sij)Rt×d,每个元素 s i j s_{ij} sij独立同分布于 N ( 0 , 1 ) N(0,1) N(0,1)

👉前提 2 2 2:对任意固定向量 u ∈ R d × 1 u\text{∈}\mathbb{R}^{d\text{×}1} uRd×1(即 u ′ u^{\prime} u不随机),定义 u ′ = 1 t ( S u ) u^{\prime}\text{=}\cfrac{1}{\sqrt{t}}(Su) u=t 1(Su)

👉:结论 1 1 1 E [ ∥ u ′ ∥ 2 ] = ∥ u ∥ 2 \text{E}\left[\left\|u^{\prime}\right\|^2\right]\text{=}\|u\|^2 E[u2]=u2,即 ∥ u ′ ∥ 2 \left\|u^{\prime}\right\|^2 u2 ∥ u ∥ 2 \|u\|^2 u2在统计学上是相等的

👉结论 2 2 2 Pr [ ∥ u ′ ∥ 2 ∉ ( 1 ± ε ) ∥ u ∥ 2 ] ≤ 2 e – ( ε 2 – ε 3 ) t 4 \text{Pr}\left[\left\|u^{\prime}\right\|^2\notin{}(1\text{±}\varepsilon{})\|u\|^2\right]\text{≤}2e^{–\left(\varepsilon{}^2–\varepsilon{}^3\right)\frac{t}{4}} Pr[u2/(1±ε)u2]2e(ε2ε3)4t,即 ∥ u ′ ∥ 2 \left\|u^{\prime}\right\|^2 u2 ∥ u ∥ 2 \|u\|^2 u2在实际值上偏差极小且可控

2.2. \textbf{2.2. } 2.2. 引理 2 \textbf{2} 2的证明

2.2.1. \textbf{2.2.1. } 2.2.1. 对结论 1 \textbf{1} 1的证明

↪对于 s i j ∼ N ( 0 , 1 ) s_{ij}\sim{}N(0,1) sijN(0,1),则有 S ⋅ j u = ∑ i = 1 d s i j u i ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\text{=}\sum_{i=1}^{d}s_{ij}u_i\sim{}N(0,\|u\|^2) Sju=i=1dsijuiN(0,u2)

  • 均值 E [ S ⋅ j u ] =E [ ∑ i = 1 d s i j u i ] = ∑ i = 1 d u i E [ s i j ] = 0 \displaystyle{}\text{E}\left[S_{\cdot{}j}u\right]\text{=}\text{E}\left[\sum_{i=1}^ds_{ij}u_i\right]\text{=}\sum_{i=1}^du_i\text{E}\left[s_{ij}\right]\text{=}0 E[Sju]=E[i=1dsijui]=i=1duiE[sij]=0
  • 方差 Var [ S ⋅ j u ] =Var [ ∑ i = 1 d s i j u i ] = ∑ i = 1 d Var [ s i j u i ] = ∑ i = 1 d u i 2 Var [ s i j ] = ∑ i = 1 d u i 2 = ∥ u ∥ 2 \displaystyle{}\text{Var}\left[S_{\cdot{}j}u\right]\text{=}\text{Var}\left[\sum_{i=1}^ds_{ij}u_i\right]\text{=}\sum_{i=1}^d\text{Var}[s_{ij}u_i]\text{=}\sum_{i=1}^du_i^2\text{Var}[s_{ij}]\text{=}\sum_{i=1}^du_i^2\text{=}\|u\|^2 Var[Sju]=Var[i=1dsijui]=i=1dVar[sijui]=i=1dui2Var[sij]=i=1dui2=u2

↪正态分布性质 E [ X 2 ] = σ 2 \text{E}[X^2]\text{=}\sigma{}^2 E[X2]=σ2,所以 E [ ( S ⋅ j u ) 2 ] = ∥ u ∥ 2 \text{E}\left[\left(S_{\cdot{}j}u\right)^2\right]\text{=}\|u\|^2 E[(Sju)2]=u2

↪所以 E [ ∥ S u ∥ 2 ] =E [ ∑ j = 1 t ( S ⋅ j u ) 2 ] = ∑ j = 1 t E [ ( S ⋅ j u ) 2 ] = t ∥ u ∥ 2 \displaystyle{}\text{E}\left[\|Su\|^2\right]\text{=}\text{E}\left[\sum_{j\text{=}1}^t\left(S_{\cdot{}j}u\right)^2\right]\text{=}\sum_{j=1}^t\text{E}\left[\left(S_{\cdot{}j}u\right)^2\right]\text{=}t\|u\|^2 E[Su2]=E[j=1t(Sju)2]=j=1tE[(Sju)2]=tu2

↪根据 u ′ = 1 t ( S u ) u^{\prime}\text{=}\cfrac{1}{\sqrt{t}}(Su) u=t 1(Su),得到 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 \left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2 u2=t1Su2

↪所以 E [ ∥ u ′ ∥ 2 ] =E [ 1 t ∥ S u ∥ 2 ] = 1 t E [ ∥ S u ∥ 2 ] = 1 t ( t ∥ u ∥ 2 ) = ∥ u ∥ 2 \displaystyle{}\text{E}\left[\left\|u^{\prime}\right\|^2\right]\text{=}\text{E}\left[\cfrac{1}{t}\|Su\|^2\right]\text{=}\cfrac{1}{t}\text{E}\left[\|Su\|^2\right]\text{=}\cfrac{1}{t}\left(t\|u\|^2\right)\text{=}\|u\|^2 E[u2]=E[t1Su2]=t1E[Su2]=t1(tu2)=u2

2.2.2. \textbf{2.2.2. } 2.2.2. 对结论 2 \textbf{2} 2的证明(正半边)

↪考虑到 S ⋅ j u ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\sim{}N(0,\|u\|^2) SjuN(0,u2),故将其归一化为 X j = S ⋅ j u ∥ u ∥ ∼ N ( 0 , 1 ) X_j\text{=}\cfrac{S_{\cdot{}j}u}{\|u\|}\sim{}N(0,1) Xj=uSjuN(0,1)

↪由此定义 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2(自由度为 t t t χ 2 \chi^2 χ2分布),由此 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 = 1 t ∑ j = 1 t ( S ⋅ j u ) 2 = ∥ u ∥ 2 1 t ∑ j = 1 t X j 2 = 1 t ∥ u ∥ 2 X \displaystyle{}\left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2\text{=}\cfrac{1}{t}\sum_{j=1}^t\left(S_{\cdot{}j}u\right)^2\text{=}\|u\|^2\cfrac{1}{t}\sum_{j=1}^tX_j^2\text{=}\cfrac{1}{t}\|u\|^2X u2=t1Su2=t1j=1t(Sju)2=u2t1j=1tXj2=t1u2X

↪由此 Pr [ ∥ u ′ ∥ 2 ≥ ( 1 + ε ) ∥ u ∥ 2 ] =Pr [ X ≥ ( 1 + ε ) t ] \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≥}(1\text{+}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right] Pr[u2(1+ε)u2]=Pr[X(1+ε)t]

↪考虑马可夫不等式的指数形式: Pr [ X ≥ ( 1 + ε ) t ] =Pr [ e α X ≥ e α ( 1 + ε ) t ] ≤ E [ e α X ] e α ( 1 + ε ) t \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{=}\text{Pr}\left[e^{\alpha{}X}\text{≥}e^{\alpha{}(1\text{+}\varepsilon{})t}\right]\text{≤}\cfrac{\text{E}\left[e^{\alpha{}X}\right]}{e^{\alpha{}(1\text{+}\varepsilon{})t}} Pr[X(1+ε)t]=Pr[eαXeα(1+ε)t]eα(1+ε)tE[eαX]

  • 考虑到 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2,所以 E [ e α X ] =E [ e α ( X 1 2 + X 2 2 + ⋯ + X t 2 ) ] =E [ e α X 1 2 e α X 2 2 ⋯ e α X t 2 ] =E [ ∏ j = 1 t e α X j 2 ] = ∏ j = 1 t E [ e α X j 2 ] \displaystyle{}\text{E}\left[e^{\alpha{}X}\right]\text{=}\text{E}\left[e^{\alpha{}(X^2_1\text{+}X^2_2\text{+}\cdots\text{+}X^2_t)}\right]\text{=}\text{E}\left[e^{\alpha{}X^2_1}e^{\alpha{}X^2_2}\cdots{}e^{\alpha{}X^2_t}\right]\text{=}\text{E}\left[\prod_{j=1}^te^{\alpha{}X^2_j}\right]\text{=}\prod_{j=1}^t\text{E}\left[e^{\alpha{}X_j^2}\right] E[eαX]=E[eα(X12+X22++Xt2)]=E[eαX12eαX22eαXt2]=E[j=1teαXj2]=j=1tE[eαXj2]
  • 在引理 1 1 1中已经证明 E [ e α X j 2 ] = 1 1 – 2 α σ 2 ( α < 1 2 σ 2 ) \text{E}\left[e^{\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}\sigma^{2}}}(\alpha{}\text{<}\cfrac{1}{2\sigma^{2}}) E[eαXj2]=1–2ασ2 1(α<2σ21),考虑到此处 σ ( X j ) = 1 \sigma({X_j})\text{=}1 σ(Xj)=1所以 E [ e α X j 2 ] = 1 1 – 2 α ( α < 1 2 ) \text{E}\left[e^{\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1–2\alpha{}}}(\alpha{}\text{<}\cfrac{1}{2}) E[eαXj2]=1–2α 1(α<21)
  • 所以 E [ e α X ] = ∏ j = 1 t ( 1 1 – 2 α ) = ( 1 1 – 2 α ) t = 1 ( 1 – 2 α ) t 2 \displaystyle{}\text{E}\left[e^{\alpha{}X}\right]\text{=}\prod_{j=1}^t\left(\cfrac{1}{\sqrt{1–2\alpha{}}}\right)\text{=}\left(\cfrac{1}{\sqrt{1–2\alpha{}}}\right)^t\text{=}\cfrac{1}{(1–2\alpha)^{\frac{t}{2}}} E[eαX]=j=1t(1–2α 1)=(1–2α 1)t=(1–2α)2t1
  • 代入原式得 Pr [ X ≥ ( 1 + ε ) t ] ≤ E [ e α X ] e α ( 1 + ε ) t = ( 1 – 2 α ) – t 2 e α ( 1 + ε ) t = ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\cfrac{\text{E}\left[e^{\alpha{}X}\right]}{e^{\alpha{}(1\text{+}\varepsilon{})t}}\text{=}\cfrac{{(1–2\alpha)^{–\frac{t}{2}}}}{e^{\alpha{}(1\text{+}\varepsilon{})t}}\text{=}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} Pr[X(1+ε)t]eα(1+ε)tE[eαX]=eα(1+ε)t(1–2α)2t=(1–2αe–2(1+ε)α)2t

↪对于 Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t,有必要在 0 < α < 1 2 0\text{<}\alpha{}\text{<}\cfrac{1}{2} 0<α<21的范围内确定 f ( α ) = ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 f(\alpha)\text{=}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}} f(α)=(1–2αe–2(1+ε)α)2t的最小值

  • 对于 ln ⁡ ( f ( α ) ) = t 2 [ – 2 ( 1 + ε ) α – ln ⁡ ( 1 – 2 α ) ] \ln(f(\alpha))\text{=}\cfrac{t}{2}[–2(1\text{+}\varepsilon)\alpha–\ln(1–2\alpha)] ln(f(α))=2t[–2(1+ε)αln(1–2α)],令 g ( α ) =– 2 ( 1 + ε ) α – ln ⁡ ( 1 – 2 α ) g(\alpha)\text{=}–2(1\text{+}\varepsilon)\alpha–\ln(1–2\alpha) g(α)=–2(1+ε)αln(1–2α),如下图( ε = 3 \varepsilon\text{=}3 ε=3)

    image-20250123232509535
  • 一阶导 d g ( α ) d α = 2 1 – 2 α – 2 ( 1 + ε ) \cfrac{\text{d}g{(\alpha)}}{\text{d}\alpha}\text{=}\cfrac{2}{1–2\alpha}–2(1\text{+}\varepsilon) dαdg(α)=1–2α2–2(1+ε),具有临界点 α ∗ = ε 2 ( 1 + ε ) ∈ ( 0 , 1 2 ) \alpha^*\text{=}\cfrac{\varepsilon}{2(1\text{+}\varepsilon)}\text{∈}\left(0,\cfrac{1}{2}\right) α=2(1+ε)ε(0,21),故 ε > 0 \varepsilon\text{>}0 ε>0

  • 代入原式即得 Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 ≤ ( ( 1 + ε ) e – ε ) t 2 \text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1\text{+}\varepsilon) e^{–\varepsilon}\right)^{\frac{t}{2}} Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t((1+ε)eε)2t

↪进一步对 h ( ε ) = ( ( 1 + ε ) e – ε ) t 2 h(\varepsilon)\text{=}\left((1\text{+}\varepsilon)e^{–\varepsilon}\right)^{\frac{t}{2}} h(ε)=((1+ε)eε)2t的分析

  • 泰勒展开 ln ⁡ ( 1 + ε ) = ε – ε 2 2 + ε 3 3 + O ( ε 4 ) \ln{}(1\text{+}\varepsilon)\text{=}\varepsilon–\cfrac{\varepsilon^2}{2}\text{+}\cfrac{\varepsilon^3}{3}\text{+}O\left(\varepsilon^4\right) ln(1+ε)=ε2ε2+3ε3+O(ε4),则 ln ⁡ ( 1 + ε ) – ε ≤– ε 2 2 + ε 3 3 ≤– 1 2 ( ε 2 – ε 3 ) \ln(1\text{+}\varepsilon)–\varepsilon\text{≤}–\cfrac{\varepsilon^2}{2}\text{+}\cfrac{\varepsilon^3}{3}\text{≤}–\cfrac{1}{2}\left(\varepsilon^2–\varepsilon^3\right) ln(1+ε)ε2ε2+3ε321(ε2ε3)
  • 故在 ln ⁡ ( h ( ε ) ) = t 2 ( ln ⁡ ( 1 + ε ) – ε ) ≤– t 4 ( ε 2 – ε 3 ) \ln(h(\varepsilon))\text{=}\cfrac{t}{2}(\ln(1\text{+}\varepsilon)–\varepsilon)\text{≤}–\cfrac{t}{4}\left(\varepsilon^2–\varepsilon^3\right) ln(h(ε))=2t(ln(1+ε)ε)4t(ε2ε3),即 h ( ε ) ≤ e – t 4 ( ε 2 – ε 3 ) h(\varepsilon)\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} h(ε)e4t(ε2ε3)

↪最后 Pr [ ∥ u ′ ∥ 2 ≥ ( 1 + ε ) ∥ u ∥ 2 ] =Pr [ X ≥ ( 1 + ε ) t ] ≤ ( e – 2 ( 1 + ε ) α 1 – 2 α ) t 2 ≤ ( ( 1 + ε ) e – ε ) t 2 ≤ e – t 4 ( ε 2 – ε 3 ) \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≥}(1\text{+}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≥}(1\text{+}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{–2(1\text{+}\varepsilon)\alpha}}{1–2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1\text{+}\varepsilon) e^{–\varepsilon}\right)^{\frac{t}{2}}\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} Pr[u2(1+ε)u2]=Pr[X(1+ε)t](1–2αe–2(1+ε)α)2t((1+ε)eε)2te4t(ε2ε3)

2.2.3. \textbf{2.2.3. } 2.2.3. 对结论 2 \textbf{2} 2的证明(负半边)

↪考虑到 S ⋅ j u ∼ N ( 0 , ∥ u ∥ 2 ) \displaystyle{}S_{\cdot{}j}u\sim{}N(0,\|u\|^2) SjuN(0,u2),故将其归一化为 X j = S ⋅ j u ∥ u ∥ ∼ N ( 0 , 1 ) X_j\text{=}\cfrac{S_{\cdot{}j}u}{\|u\|}\sim{}N(0,1) Xj=uSjuN(0,1)

↪由此定义 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2(自由度为 t t t χ 2 \chi^2 χ2分布),由此 ∥ u ′ ∥ 2 = 1 t ∥ S u ∥ 2 = 1 t ∑ j = 1 t ( S ⋅ j u ) 2 = ∥ u ∥ 2 1 t ∑ j = 1 t X j 2 = 1 t ∥ u ∥ 2 X \displaystyle{}\left\|u^{\prime}\right\|^2\text{=}\cfrac{1}{t}\|Su\|^2\text{=}\cfrac{1}{t}\sum_{j=1}^t\left(S_{\cdot{}j}u\right)^2\text{=}\|u\|^2\cfrac{1}{t}\sum_{j=1}^tX_j^2\text{=}\cfrac{1}{t}\|u\|^2X u2=t1Su2=t1j=1t(Sju)2=u2t1j=1tXj2=t1u2X

↪由此 Pr [ ∥ u ′ ∥ 2 ≤ ( 1 – ε ) ∥ u ∥ 2 ] =Pr [ X ≤ ( 1 – ε ) t ] =Pr [ – X ≥– ( 1 – ε ) t ] \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≤}(1\text{–}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[X\text{≤}(1\text{–}\varepsilon{})t\right]\text{=}\text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right] Pr[u2(1ε)u2]=Pr[X(1ε)t]=Pr[X(1ε)t]

↪考虑马可夫不等式的指数形式: Pr [ – X ≥– ( 1 – ε ) t ] =Pr [ e α ( – X ) ≥ e – α ( 1 – ε ) t ] ≤ E [ e – α X ] e – α ( 1 – ε ) t \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{=}\text{Pr}\left[e^{\alpha{}(–X)}\text{≥}e^{–\alpha{}(1\text{–}\varepsilon{})t}\right]\text{≤}\cfrac{\text{E}\left[e^{–\alpha{}X}\right]}{e^{–\alpha{}(1\text{–}\varepsilon{})t}} Pr[X(1ε)t]=Pr[eα(X)eα(1ε)t]eα(1ε)tE[eαX]

  • 考虑到 X = ∑ j = 1 t X j 2 \displaystyle{}X\text{=}\sum_{j=1}^tX_j^2 X=j=1tXj2,所以 E [ e – α X ] =E [ e – α ( X 1 2 + X 2 2 + ⋯ + X t 2 ) ] =E [ e – α X 1 2 e – α X 2 2 ⋯ e – α X t 2 ] =E [ ∏ j = 1 t e – α X j 2 ] = ∏ j = 1 t E [ e – α X j 2 ] \displaystyle{}\text{E}\left[e^{–\alpha{}X}\right]\text{=}\text{E}\left[e^{–\alpha{}(X^2_1\text{+}X^2_2\text{+}\cdots\text{+}X^2_t)}\right]\text{=}\text{E}\left[e^{–\alpha{}X^2_1}e^{–\alpha{}X^2_2}\cdots{}e^{–\alpha{}X^2_t}\right]\text{=}\text{E}\left[\prod_{j=1}^te^{–\alpha{}X_j^2}\right]\text{=}\prod_{j=1}^t\text{E}\left[e^{–\alpha{}X_j^2}\right] E[eαX]=E[eα(X12+X22++Xt2)]=E[eαX12eαX22eαXt2]=E[j=1teαXj2]=j=1tE[eαXj2]
  • 在引理 1 1 1中已经证明 E [ e – α X j 2 ] = 1 1 + 2 α σ 2 ( α >– 1 2 σ 2 ) \text{E}\left[e^{–\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1\text{+}2\alpha{}\sigma^{2}}}(\alpha{}\text{>}–\cfrac{1}{2\sigma^{2}}) E[eαXj2]=1+2ασ2 1(α>2σ21),考虑到此处 σ ( X j ) = 1 \sigma({X_j})\text{=}1 σ(Xj)=1所以 E [ e – α X j 2 ] = 1 1 + 2 α ( α >– 1 2 ) \text{E}\left[e^{–\alpha{}X_j^{2}}\right]\text{=}\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}(\alpha{}\text{>}–\cfrac{1}{2}) E[eαXj2]=1+2α 1(α>21)
  • 所以 E [ e – α X ] = ∏ j = 1 t ( 1 1 + 2 α ) = ( 1 1 + 2 α ) t = 1 ( 1 + 2 α ) t 2 \displaystyle{}\text{E}\left[e^{–\alpha{}X}\right]\text{=}\prod_{j=1}^t\left(\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}\right)\text{=}\left(\cfrac{1}{\sqrt{1\text{+}2\alpha{}}}\right)^t\text{=}\cfrac{1}{(1\text{+}2\alpha)^{\frac{t}{2}}} E[eαX]=j=1t(1+2α 1)=(1+2α 1)t=(1+2α)2t1
  • 代入原式得 Pr [ – X ≥– ( 1 – ε ) t ] ≤ E [ e – α X ] e – α ( 1 – ε ) t = ( 1 + 2 α ) – t 2 e – α ( 1 – ε ) t = ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\cfrac{\text{E}\left[e^{–\alpha{}X}\right]}{e^{–\alpha{}(1–\varepsilon{})t}}\text{=}\cfrac{{(1\text{+}2\alpha)^{–\frac{t}{2}}}}{e^{–\alpha{}(1–\varepsilon{})t}}\text{=}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} Pr[X(1ε)t]eα(1–ε)tE[eαX]=eα(1–ε)t(1+2α)2t=(1+2αe2(1–ε)α)2t

↪对于 Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} Pr[X(1ε)t](1+2αe2(1–ε)α)2t,有必要在 α >– 1 2 \alpha{}\text{>}–\cfrac{1}{2} α>21的范围内确定 f ( α ) = ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 f(\alpha)\text{=}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}} f(α)=(1+2αe2(1–ε)α)2t的最小值

  • 对于 ln ⁡ ( f ( α ) ) = t 2 [ 2 ( 1 – ε ) α – ln ⁡ ( 1 + 2 α ) ] \ln(f(\alpha))\text{=}\cfrac{t}{2}[2(1–\varepsilon)\alpha–\ln(1\text{+}2\alpha)] ln(f(α))=2t[2(1–ε)αln(1+2α)],令 g ( α ) = [ 2 ( 1 – ε ) α – ln ⁡ ( 1 + 2 α ) ] g(\alpha)\text{=}[2(1–\varepsilon)\alpha–\ln(1\text{+}2\alpha)] g(α)=[2(1–ε)αln(1+2α)],如下图( ε =– 1 3 \varepsilon\text{=}–\cfrac{1}{3} ε=31)
    image-20250123232509535
  • 一阶导 d g ( α ) d α =– 2 1 + 2 α + 2 ( 1 + ε ) \cfrac{\text{d}g{(\alpha)}}{\text{d}\alpha}\text{=}–\cfrac{2}{1\text{+}2\alpha}\text{+}2(1\text{+}\varepsilon) dαdg(α)=1+2α2+2(1+ε),具有临界点 α ∗ = ε 2 ( 1 – ε ) ∈ ( – 1 2 , +∞ ) \alpha^*\text{=}\cfrac{\varepsilon}{2(1–\varepsilon)}\text{∈}\left(–\cfrac{1}{2},\text{+∞}\right) α=2(1–ε)ε(21,+∞),故 – 1 < ε < 1 –1\text{<}\varepsilon\text{<}1 –1<ε<1(由于前提限制故截取为 0 < ε < 1 0\text{<}\varepsilon\text{<}1 0<ε<1)
  • 代入原式即得 Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 ≤ ( ( 1 – ε ) e ε ) t 2 \text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}} Pr[X(1ε)t](1+2αe2(1–ε)α)2t((1–ε)eε)2t

↪进一步对 h ( ε ) = ( ( 1 – ε ) e ε ) t 2 h(\varepsilon)\text{=}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}} h(ε)=((1–ε)eε)2t的分析

  • 泰勒展开 ln ⁡ ( 1 – ε ) =– ε – ε 2 2 – ε 3 3 + O ( ε 4 ) \ln{}(1–\varepsilon)\text{=}–\varepsilon–\cfrac{\varepsilon^2}{2}–\cfrac{\varepsilon^3}{3}\text{+}O\left(\varepsilon^4\right) ln(1–ε)=ε2ε23ε3+O(ε4),则 ln ⁡ ( 1 – ε ) + ε ≤– ε 2 2 – ε 3 3 ≤– 1 2 ( ε 2 – ε 3 ) \ln(1–\varepsilon)\text{+}\varepsilon\text{≤}–\cfrac{\varepsilon^2}{2}–\cfrac{\varepsilon^3}{3}\text{≤}–\cfrac{1}{2}\left(\varepsilon^2–\varepsilon^3\right) ln(1–ε)+ε2ε23ε321(ε2ε3)
  • 故在 ln ⁡ ( h ( ε ) ) = t 2 ( ln ⁡ ( 1 – ε ) + ε ) ≤– t 4 ( ε 2 – ε 3 ) \ln(h(\varepsilon))\text{=}\cfrac{t}{2}(\ln(1–\varepsilon)\text{+}\varepsilon)\text{≤}–\cfrac{t}{4}\left(\varepsilon^2–\varepsilon^3\right) ln(h(ε))=2t(ln(1–ε)+ε)4t(ε2ε3),即 h ( ε ) ≤ e – t 4 ( ε 2 – ε 3 ) h(\varepsilon)\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} h(ε)e4t(ε2ε3)

↪最后 Pr [ ∥ u ′ ∥ 2 ≤ ( 1 – ε ) ∥ u ∥ 2 ] =Pr [ – X ≥– ( 1 – ε ) t ] ≤ ( e 2 ( 1 – ε ) α 1 + 2 α ) t 2 ≤ ( ( 1 – ε ) e ε ) t 2 ≤ e – t 4 ( ε 2 – ε 3 ) \text{Pr}\left[\left\|u^{\prime}\right\|^2\text{≤}(1\text{–}\varepsilon)\|u\|^2\right]\text{=}\text{Pr}\left[–X\text{≥}–(1\text{–}\varepsilon{})t\right]\text{≤}\left(\cfrac{e^{2(1–\varepsilon)\alpha}}{1\text{+}2\alpha}\right)^{\frac{t}{2}}\text{≤}\left((1–\varepsilon) e^{\varepsilon}\right)^{\frac{t}{2}}\text{≤}e^{–\frac{t}{4}\left(\varepsilon^2–\varepsilon^3\right)} Pr[u2(1ε)u2]=Pr[X(1ε)t](1+2αe2(1–ε)α)2t((1–ε)eε)2te4t(ε2ε3)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/68130.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言-构造数据类型

1、构造数据类型 结构体、共用体、枚举。 2、结构体 1、结构体的定义 结构体是一个自定义的复合数据类型&#xff0c;它允许将不同类型的数据组合在一起。 struct 结构体名 {数据类型1 成员变量1;数据类型2 成员变量2;数据类型3 成员变量3;数据类型4 成员变量4; } 2、结构体变…

CLOUDFLARE代理请求重定向你太多次

现象 使用CLOUDFLARE代理前请求正常&#xff0c;使用CLOUDFLARE代理请求后出现 原因分析 以下是我的猜测&#xff0c;在默认情况下 CLOUDFLARE代理&#xff0c;可能是直接请求我们服务器的IP&#xff0c;比如&#xff1a;http://1.1.1.1 而不是通过域名的方式&#xff08;如…

vue router路由复用及刷新问题研究

路由复用问题 当路由匹配路径未发生变化时&#xff0c;只是相关的参数发生了变化&#xff0c;路由跳转时&#xff0c;会发现虽然地址栏中的地址更新到了新的链接&#xff0c;但是页面渲染并未触发响应路由组件的created,mounted等钩子函数&#xff0c;也就意味着组件并没有被重…

Android各个版本存储权限适配

一、Android6.0-9.0 1、动态权限申请&#xff1a; private static String[] arrPermissions {android.Manifest.permission.READ_EXTERNAL_STORAGE, android.Manifest.permission.WRITE_EXTERNAL_STORAGE,android.Manifest.permission.ACCESS_FINE_LOCATION,android.Manifest.…

房租管理系统的智能化应用助推租赁行业高效运营与决策优化

内容概要 在现代租赁行业中&#xff0c;房租管理系统的智能化应用正在逐步成为一个不可或缺的工具。通过整合最新技术&#xff0c;这些系统为租赁管理的各个方面提供了极大的便利和效率提升。从房源管理到合同签署再到财务监控&#xff0c;智能化功能能够帮助运营者在繁琐的事…

数据结构初阶之队列的介绍与队列的实现

一、概念与结构 概念&#xff1a;只允许在一端进行插入数据操作&#xff0c;在另一端进行删除数据操作的特殊线性表&#xff0c;队列具有先进先出 FIFO (First In First Out) 的特点。 入队列&#xff1a;进行插入操作的一端称为队尾 出队列&#xff1a;进行删除操作的一端称为…

GTO 门级可关断晶闸管,全控性器件

介绍 门级可关断晶闸管是一种通过门极来控制器件导通和关断的电力半导体器件。 结构特点 - 四层半导体结构&#xff1a;与普通晶闸管相似&#xff0c;GTO也是由PNPN四层半导体构成&#xff0c;外部引出三个电极&#xff0c;分别是阳极&#xff08;A&#xff09;、阴极&#x…

FlinkSql使用中rank/dense_rank函数报错空指针

问题描述 在flink1.16(甚至以前的版本)中&#xff0c;使用rank()或者dense_rank()进行排序时&#xff0c;某些场景会导致报错空指针NPE(NullPointerError) 报错内容如下 该报错没有行号/错误位置&#xff0c;无法排查 现状 目前已经确认为bug&#xff0c;根据github上的PR日…

序列标注:从传统到现代,NLP中的标签预测技术全解析

引言 序列标注任务是自然语言处理&#xff08;NLP&#xff09;中的核心任务之一&#xff0c;广泛应用于信息抽取、文本分类、机器翻译等领域。随着深度学习技术的快速发展&#xff0c;序列标注任务的性能得到了显著提升。本文将从基础概念入手&#xff0c;逐步深入探讨序列标注…

速通Docker === Docker Compose

目录 Docker Compose 简介 Docker Compose 常用命令 使用 Docker Compose 启动 WordPress 普通启动方式&#xff08;使用 Docker 命令&#xff09; 使用 Docker Compose 启动 Docker Compose 的特性 Docker Compose 简介 Docker Compose 是一个用于定义和运行多容器 Dock…

ESP32服务器和PC客户端的Wi-Fi通信

ESP32客户端-服务器Wi-Fi通信 本指南将向您展示如何设置ESP32板作为服务端&#xff0c;PC作为客户端&#xff0c;通过HTTP通信&#xff0c;以通过Wi-Fi&#xff08;无需路由器或互联网连接&#xff09;交换数据。简而言之&#xff0c;您将学习如何使用HTTP请求将一个板的数据发…

为什么IDEA提示不推荐@Autowired❓️如果使用@Resource呢❓️

前言 在使用 Spring 框架时&#xff0c;依赖注入&#xff08;DI&#xff09;是一个非常重要的概念。通过注解&#xff0c;我们可以方便地将类的实例注入到其他类中&#xff0c;提升开发效率。Autowired又是被大家最为熟知的方式&#xff0c;但很多开发者在使用 IntelliJ IDEA …

如何用数据编织、数据虚拟化与SQL-on-Hadoop打造实时、可扩展兼容的数据仓库?

在大数据技术迅猛发展的背景下&#xff0c;许多人认为传统数据仓库已过时。然而&#xff0c;这种观点忽略了数据仓库的核心价值&#xff1a;统一的数据视图、强大的业务逻辑支撑以及丰富的数据分析能力。在企业数据架构转型中&#xff0c;数据仓库不仅未被淘汰&#xff0c;反而…

DuckDB:Golang操作DuckDB实战案例

DuckDB是一个嵌入式SQL数据库引擎。它与众所周知的SQLite非常相似&#xff0c;但它是为olap风格的工作负载设计的。DuckDB支持各种数据类型和SQL特性。凭借其在以内存为中心的环境中处理高速分析的能力&#xff0c;它迅速受到数据科学家和分析师的欢迎。在这篇博文中&#xff0…

day1代码练习

输出3-100以内的完美数&#xff0c;(完美数&#xff1a;因子和(因子不包含自身)数本身) #include <stdio.h>// 判断一个数是否为完美数的函数 int panduan(int n) {if (n < 2) {return 0; // 小于2的数不可能是完美数}int sum 1; // 因子和初始化为1&#xff08;因…

dify大模型应用开发平台搭建

原文地址&#xff1a;dify大模型应用开发平台搭建 – 无敌牛 欢迎参观我的技术分享网站&#xff1a;无敌牛 – 技术/著作/典籍/分享等 之前分享了一个私有化部署开源大模型的方法&#xff0c;具体参看往期文章&#xff1a;私有化部署开源AI模型 – 无敌牛 今天搭建一个大模型…

Spring Boot 邂逅Netty:构建高性能网络应用的奇妙之旅

一、引言 在当今数字化时代&#xff0c;构建高效、可靠的网络应用是开发者面临的重要挑战。Spring Boot 作为一款强大的 Java 开发框架&#xff0c;以其快速开发、简洁配置和丰富的生态支持&#xff0c;深受广大开发者喜爱。而 Netty 作为高性能、异步的网络通信框架&#xff…

Spring--SpringMVC使用(接收和响应数据、RESTFul风格设计、其他扩展)

SpringMVC使用 二.SpringMVC接收数据2.1访问路径设置2.2接收参数1.param和json2.param接收数据3 路径 参数接收4.json参数接收 2.3接收cookie数据2.4接收请求头数据2.5原生api获取2.6共享域对象 三.SringMVC响应数据3.1返回json数据ResponseBodyRestController 3.2返回静态资源…

Unity在WebGL中拍照和录视频

原工程地址https://github.com/eangulee/UnityWebGLRecoder Unity版本2018.3.6f1&#xff0c;有点年久失修了 https://github.com/xue-fei/Unity.WebGLRecorder 修改jslib适配了Unity2021 效果图 录制的视频 Unity在WebGL中拍照和录视频

数据结构——AVL树的实现

Hello&#xff0c;大家好&#xff0c;这一篇博客我们来讲解一下数据结构中的AVL树这一部分的内容&#xff0c;AVL树属于是数据结构的一部分&#xff0c;顾名思义&#xff0c;AVL树是一棵特殊的搜索二叉树&#xff0c;我们接下来要讲的这篇博客是建立在了解搜索二叉树这个知识点…