2. Relation to Normal Distribution
疑问:有没有不各向同性的 vMF?
答:应该是没有的,如果想让各方向偏离中心的速度不一致,则协方差矩阵不为 I \bm{I} I 的倍数. 正态分布的概率密度函数为: f ( x ) = 1 ( 2 π ) p ∣ Σ ∣ e − 1 2 ( x − μ ) ⊺ Σ − 1 ( x − μ ) \begin{aligned} f(\bm{x}) = \frac{1}{\sqrt{(2\pi)^p |\Sigma|}} e^{-\frac{1}{2} (\bm{x}-\bm{\mu})^\intercal\Sigma^{-1}(\bm{x}-\bm{\mu})} \end{aligned} f(x)=(2π)p∣Σ∣1e−21(x−μ)⊺Σ−1(x−μ) 类比上面的推导,我们需要得出形似: G p ( x ; μ , κ ) = C ( p , κ , r ) e x p ( κ r μ ⊺ r Σ − 1 x ) \begin{aligned} G_p(\bm{x}; \bm{\mu}, \kappa) &= C(p,\kappa,r) exp\left(\kappa r \frac{\bm{\mu}^\intercal}{r} \Sigma^{-1} \bm{x} \right) \end{aligned} Gp(x;μ,κ)=C(p,κ,r)exp(κrrμ⊺Σ−1x) 的东西,所以,必要的,需要: x ⊺ Σ − 1 x = c o n s t \begin{aligned} \bm{x}^{\intercal} \Sigma^{-1} \bm{x} &= const \end{aligned} x⊺Σ−1x=const 我们知道,要想让 x ⊺ Σ − 1 x = c o n s t \bm{x}^{\intercal} \Sigma^{-1} \bm{x} = const x⊺Σ−1x=const 表示为球,则必须使 Σ − 1 = α I \Sigma^{-1}=\alpha \bm{I} Σ−1=αI,所以,假设不了“协方差矩阵不为 I \bm{I} I 的倍”, 也就不可能存在不各向同性的 vMF.
[注]: x ⊺ Σ − 1 x = c o n s t \bm{x}^{\intercal} \Sigma^{-1} \bm{x} = const x⊺Σ−1x=const,表示一般的超椭球。
等等!对于 x \bm{x} x 来说, 即使它不是单位向量,也代表了一个方向, x ∥ x ∥ \frac{\bm{x}}{\|\bm{x}\|} ∥x∥x 的分布会是非各向同性的 vMF 吗?有可能是哎!
假设 y = [ y 1 y 2 ] = [ 1 0 0 2 ] [ x 1 x 2 ] = A x \bm{y} = \begin{bmatrix} y_1 \\ y_2 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \bm{Ax} y=[y1y2]=[1002][x1x2]=Ax, y \bm{y} y 代表单位圆的话,则 x \bm{x} x 在椭圆 x 1 2 + ( 2 x 2 ) 2 = 1 x_1^2 + (2x_2)^2 = 1 x12+(2x2)2=1 上,如下图:
可以看到,B 和 D 点是对应的,那么弧 AB 和 AD 的“点数”应该是一样的,而弧 AB 对应的方向却在弧 AC 上,即 AD 段对应的方向,被压缩在了 AC 段,如果采样 y \bm{y} y 的话,对应的 x \bm{x} x 方向会更集中趋于椭圆的长轴,实现了“非各向同性”,只不过分布在椭圆上,且采样后需要归一化处理。
拒绝采样
首先, 设 Y ∼ B e ( α , β ) Y \sim Be(\alpha, \beta) Y∼Be(α,β), 概率密度函数为: f ( y ; α , β ) = y α − 1 ( 1 − y ) β − 1 ∫ 0 1 u α − 1 ( 1 − u ) β − 1 d u = Γ ( α + β ) Γ ( α ) Γ ( β ) y α − 1 ( 1 − y ) β − 1 = 1 B ( α , β ) y α − 1 ( 1 − y ) β − 1 \begin{aligned} f(y; \alpha, \beta) &= \frac{y^{\alpha-1}(1-y)^{\beta-1}}{\int_0^1 u^{\alpha-1}(1-u)^{\beta-1} du} \\ &= \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} y^{\alpha-1}(1-y)^{\beta-1} \\ &= \frac{1}{\Beta(\alpha,\beta)} y^{\alpha-1}(1-y)^{\beta-1} \end{aligned} f(y;α,β)=∫01uα−1(1−u)β−1duyα−1(1−y)β−1=Γ(α)Γ(β)Γ(α+β)yα−1(1−y)β−1=B(α,β)1yα−1(1−y)β−1 其中 y ∈ ( 0 , 1 ) , α , β > 0 y \in (0,1), \alpha, \beta > 0 y∈(0,1),α,β>0. 令 X = 1 − ( 1 + b ) Y 1 − ( 1 − b ) Y ⇔ Y = 1 − X ( 1 + b ) − ( 1 − b ) X b ∈ ( 0 , 1 ) \begin{aligned} X = \frac{1-(1+b)Y}{1-(1-b)Y} &\Leftrightarrow Y = \frac{1-X}{(1+b)-(1-b)X} \\ b &\in (0,1) \end{aligned} X=1−(1−b)Y1−(1+b)Yb⇔Y=(1+b)−(1−b)X1−X∈(0,1) 代入上述概率密度函数 f ( y ; α , β ) f(y; \alpha, \beta) f(y;α,β), 并令 α = β = m − 1 2 \alpha=\beta=\frac{m-1}{2} α=β=2m−1 得: f ( 1 − x ( 1 + b ) − ( 1 − b ) x ; m − 1 2 , m − 1 2 ) = 1 B ( m − 1 2 , m − 1 2 ) ( ( 1 − x ( 1 + b ) − ( 1 − b ) x ) ∗ ( 1 − 1 − x ( 1 + b ) − ( 1 − b ) x ) ) m − 1 2 − 1 = 1 B ( m − 1 2 , m − 1 2 ) ( ( 1 − x ( 1 + b ) − ( 1 − b ) x ) ∗ ( ( 1 + b ) − ( 1 − b ) x − ( 1 − x ) ( 1 + b ) − ( 1 − b ) x ) ) m − 3 2 = 1 B ( m − 1 2 , m − 1 2 ) ( ( 1 − x ( 1 + b ) − ( 1 − b ) x ) ∗ ( b ( 1 + x ) ( 1 + b ) − ( 1 − b ) x ) ) m − 3 2 = 1 B ( m − 1 2 , m − 1 2 ) ( b ( 1 − x 2 ) [ ( 1 + b ) − ( 1 − b ) x ] 2 ) m − 3 2 = b m − 3 2 B ( m − 1 2 , m − 1 2 ) ( 1 − x 2 ) m − 3 2 [ ( 1 + b ) − ( 1 − b ) x ] m − 3 = e ( x , b ) 其中 x ∈ ( − 1 , 1 ) , b ∈ ( 0 , 1 ) \begin{aligned} &f(\frac{1-x}{(1+b)-(1-b)x}; \frac{m-1}{2}, \frac{m-1}{2}) \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(1-\frac{1-x}{(1+b)-(1-b)x}\right)\right)^{\frac{m-1}{2}-1} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(\frac{(1+b)-(1-b)x - (1-x)}{(1+b)-(1-b)x}\right)\right)^{\frac{m-3}{2}} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(\frac{b(1+x)}{(1+b)-(1-b)x}\right)\right)^{\frac{m-3}{2}} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\frac{b(1-x^2)}{[(1+b)-(1-b)x]^2}\right)^{\frac{m-3}{2}} \\ =& \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} \\ =& e(x,b) ~~~~~ 其中 ~ x \in (-1,1), b \in (0,1) \end{aligned} ======f((1+b)−(1−b)x1−x;2m−1,2m−1)B(2m−1,2m−1)1(((1+b)−(1−b)x1−x)∗(1−(1+b)−(1−b)x1−x))2m−1−1B(2m−1,2m−1)1(((1+b)−(1−b)x1−x)∗((1+b)−(1−b)x(1+b)−(1−b)x−(1−x)))2m−3B(2m−1,2m−1)1(((1+b)−(1−b)x1−x)∗((1+b)−(1−b)xb(1+x)))2m−3B(2m−1,2m−1)1([(1+b)−(1−b)x]2b(1−x2))2m−3B(2m−1,2m−1)b2m−3[(1+b)−(1−b)x]m−3(1−x2)2m−3e(x,b) 其中 x∈(−1,1),b∈(0,1) 与论文 Computer Generation of Distributions on the m-spher 不一致, 但我不知道问题出在哪里. 论文里明明说:
却给出了:
由拒绝采样法的 f r a d i a l ( x ; κ , m ) ≤ M ∗ e ( x , b ) f_{radial}(x;\kappa,m) \le M*e(x,b) fradial(x;κ,m)≤M∗e(x,b), 计算: M = max x f r a d i a l ( x ; κ , m ) e ( x , b ) = max x ( κ / 2 ) ν Γ ( 1 2 ) Γ ( ν + 1 2 ) I ν ( κ ) ( 1 − x 2 ) m − 3 2 e x p ( κ x ) b m − 3 2 B ( m − 1 2 , m − 1 2 ) ( 1 − x 2 ) m − 3 2 [ ( 1 + b ) − ( 1 − b ) x ] m − 3 = max x ( κ / 2 ) ν Γ ( 1 2 ) Γ ( ν + 1 2 ) I ν ( κ ) e x p ( κ x ) b m − 3 2 B ( m − 1 2 , m − 1 2 ) 1 [ ( 1 + b ) − ( 1 − b ) x ] m − 3 = max x ( κ / 2 ) ν Γ ( 1 2 ) Γ ( ν + 1 2 ) I ν ( κ ) B ( m − 1 2 , m − 1 2 ) b m − 3 2 [ ( 1 + b ) − ( 1 − b ) x ] m − 3 e x p ( κ x ) \begin{aligned} M &= \max_x \frac{f_{radial}(x;\kappa,m)}{e(x, b)} \\ &= \max_x \frac{ \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} (1-x^2)^{\frac{m-3}{2}} exp(\kappa x) }{ \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} } \\ &= \max_x \frac{ \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} exp(\kappa x) }{ \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{1}{[(1+b)-(1-b)x]^{m-3}} } \\ &= \max_x \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} \frac{\Beta(\frac{m-1}{2},\frac{m-1}{2})}{b^{\frac{m-3}{2}}} [(1+b)-(1-b)x]^{m-3} exp(\kappa x) \end{aligned} M=xmaxe(x,b)fradial(x;κ,m)=xmaxB(2m−1,2m−1)b2m−3[(1+b)−(1−b)x]m−3(1−x2)2m−3Γ(21)Γ(ν+21)Iν(κ)(κ/2)ν(1−x2)2m−3exp(κx)=xmaxB(2m−1,2m−1)b2m−3[(1+b)−(1−b)x]m−31Γ(21)Γ(ν+21)Iν(κ)(κ/2)νexp(κx)=xmaxΓ(21)Γ(ν+21)Iν(κ)(κ/2)νb2m−3B(2m−1,2m−1)[(1+b)−(1−b)x]m−3exp(κx) 接下来求极值点: ∂ ( [ ( 1 + b ) − ( 1 − b ) x ] m − 3 e x p ( κ x ) ) ∂ x = ( m − 3 ) [ ( 1 + b ) − ( 1 − b ) x ] m − 4 ∗ [ − ( 1 − b ) ] e x p ( κ x ) + [ ( 1 + b ) − ( 1 − b ) x ] m − 3 κ e x p ( κ x ) = 0 ⇒ ( m − 3 ) ∗ [ − ( 1 − b ) ] + [ ( 1 + b ) − ( 1 − b ) x ] κ = 0 ( 1 + b ) − ( 1 − b ) x = ( m − 3 ) ( 1 − b ) κ ( 1 − b ) x = ( 1 + b ) − ( m − 3 ) ( 1 − b ) κ 解 : x 0 = 1 + b 1 − b − m − 3 κ \begin{aligned} & \frac{\partial \left([(1+b)-(1-b)x]^{m-3} exp(\kappa x)\right)}{\partial x} \\ =& (m-3)[(1+b)-(1-b)x]^{m-4} * [-(1-b)] exp(\kappa x) \\ +& [(1+b)-(1-b)x]^{m-3} \kappa exp(\kappa x) = 0 \\ \Rightarrow \\ & (m-3) * [-(1-b)] + [(1+b)-(1-b)x] \kappa = 0 \\ & (1+b)-(1-b)x = \frac{(m-3)(1-b)}{\kappa} \\ & (1-b)x = (1+b) - \frac{(m-3)(1-b)}{\kappa} \\ & 解:~ x_0 = \frac{1+b}{1-b} - \frac{m-3}{\kappa} \end{aligned} =+⇒∂x∂([(1+b)−(1−b)x]m−3exp(κx))(m−3)[(1+b)−(1−b)x]m−4∗[−(1−b)]exp(κx)[(1+b)−(1−b)x]m−3κexp(κx)=0(m−3)∗[−(1−b)]+[(1+b)−(1−b)x]κ=0(1+b)−(1−b)x=κ(m−3)(1−b)(1−b)x=(1+b)−κ(m−3)(1−b)解: x0=1−b1+b−κm−3 带入之后, 求得 M M M, 为使接受率最大化(最小化 M M M), 对 b b b 求导: ∂ ( [ ( 1 + b ) − ( 1 − b ) x 0 ] m − 3 e x p ( κ x 0 ) b m − 3 2 ) ∂ b = e x p ( − m − 3 κ ) ∂ ( [ ( m − 3 ) ( 1 − b ) κ ] m − 3 e x p ( κ 1 + b 1 − b ) b m − 3 2 ) ∂ b = ( m − 3 κ ) m − 3 e x p ( − m − 3 κ ) ∂ ( ( 1 − b ) m − 3 e x p ( κ 1 + b 1 − b ) b m − 3 2 ) ∂ b = 0 ⇒ = ∂ ( ( 1 − b ) m − 3 e x p ( κ 1 + b 1 − b ) b m − 3 2 ) ∂ b = 0 = m − 3 2 ( 1 − 1 b 2 ) ( b + 1 b − 2 ) m − 5 2 e x p ( κ 1 + b 1 − b ) + ( b + 1 b − 2 ) m − 3 2 2 κ ( 1 − b ) 2 e x p ( κ 1 + b 1 − b ) ⇒ m − 3 2 ( 1 − 1 b 2 ) + ( b + 1 b − 2 ) 2 κ ( 1 − b ) 2 = 0 ( m − 3 ) ( 1 − 1 b 2 ) + 4 κ b = 0 ( m − 3 ) ( b 2 − 1 ) + 4 κ b = 0 = ( m − 3 ) b 2 + 4 κ b − ( m − 3 ) 解 : b 0 = − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 ∈ ( 0 , 1 ) \begin{aligned} & \frac{\partial \left( \frac{[(1+b)-(1-b)x_0]^{m-3} exp(\kappa x_0)}{b^{\frac{m-3}{2}}} \right)}{\partial b} \\ =& exp(-\frac{m-3}{\kappa}) \frac{\partial \left( \frac{[\frac{(m-3)(1-b)}{\kappa}]^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} \\ =& \left(\frac{m-3}{\kappa}\right)^{m-3} exp(-\frac{m-3}{\kappa}) \frac{\partial \left( \frac{(1-b)^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} = 0 \\ \Rightarrow \\ =& \frac{\partial \left( \frac{(1-b)^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} = 0 \\ =& \frac{m-3}{2} (1-\frac{1}{b^2}) (b+\frac{1}{b}-2)^{\frac{m-5}{2}} exp(\kappa \frac{1+b}{1-b}) + (b+\frac{1}{b}-2)^{\frac{m-3}{2}} \frac{2\kappa}{(1-b)^2} exp(\kappa \frac{1+b}{1-b}) \\ \Rightarrow \\ & \frac{m-3}{2} (1-\frac{1}{b^2}) + (b+\frac{1}{b}-2) \frac{2\kappa}{(1-b)^2} = 0 \\ & (m-3)(1-\frac{1}{b^2}) + \frac{4\kappa}{b} = 0 \\ & (m-3)(b^2-1) + 4\kappa b = 0 \\ =& (m-3)b^2 + 4\kappa b - (m-3) \\ & 解:~ b_0 = \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \in (0,1) \end{aligned} ==⇒==⇒=∂b∂(b2m−3[(1+b)−(1−b)x0]m−3exp(κx0))exp(−κm−3)∂b∂(b2m−3[κ(m−3)(1−b)]m−3exp(κ1−b1+b))(κm−3)m−3exp(−κm−3)∂b∂(b2m−3(1−b)m−3exp(κ1−b1+b))=0∂b∂(b2m−3(1−b)m−3exp(κ1−b1+b))=02m−3(1−b21)(b+b1−2)2m−5exp(κ1−b1+b)+(b+b1−2)2m−3(1−b)22κexp(κ1−b1+b)2m−3(1−b21)+(b+b1−2)(1−b)22κ=0(m−3)(1−b21)+b4κ=0(m−3)(b2−1)+4κb=0(m−3)b2+4κb−(m−3)解: b0=m−3−2κ+4κ2+(m−3)2∈(0,1)
如果把 ( m − 3 ) > 0 (m-3) \gt 0 (m−3)>0 和 2 κ > 0 2\kappa \gt 0 2κ>0 都看作三角形的直角边, 4 κ 2 + ( m − 3 ) 2 \sqrt{4\kappa^2+(m-3)^2} 4κ2+(m−3)2 为斜边, 则 b 0 = s e c θ − t a n θ b_0 = sec\theta - tan\theta b0=secθ−tanθ, 又 θ ∈ ( 0 , π 2 ) \theta \in (0, \frac{\pi}{2}) θ∈(0,2π), 故 b 0 ∈ ( 0 , 1 ) b_0 \in (0,1) b0∈(0,1)
以上所有的计算中, 对于原论文中的 e ( x , b ) e(x,b) e(x,b) 和本博文计算的 e ( x , b ) e(x,b) e(x,b), 差别只在于 ( m − 1 ) (m-1) (m−1) 和 ( m − 3 ) (m-3) (m−3), 其他都一样. 继续计算 x 0 x_0 x0: 1 + b 0 = 1 + − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 = m − 3 − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 = m − 3 + 4 κ 2 + ( m − 3 ) 2 − 2 κ m − 3 1 − b 0 = 1 − − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 = m − 3 + 2 κ − 4 κ 2 + ( m − 3 ) 2 m − 3 = m − 3 + 2 κ − 4 κ 2 + ( m − 3 ) 2 m − 3 x 0 = 1 + b 0 1 − b 0 − m − 3 κ = m − 3 − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 + 2 κ − 4 κ 2 + ( m − 3 ) 2 − m − 3 κ = ( m − 3 + 4 κ 2 + ( m − 3 ) 2 − 2 κ ) ( m − 3 + 4 κ 2 + ( m − 3 ) 2 + 2 κ ) ( m − 3 + 2 κ ) 2 − ( 4 κ 2 + ( m − 3 ) 2 ) − m − 3 κ = ( m − 3 + 4 κ 2 + ( m − 3 ) 2 ) 2 − 4 κ 2 ( m − 3 ) 2 + 4 κ 2 + 4 κ ( m − 3 ) − ( 4 κ 2 + ( m − 3 ) 2 ) − m − 3 κ = ( m − 3 ) 2 + 4 κ 2 + ( m − 3 ) 2 + 2 ( m − 3 ) 4 κ 2 + ( m − 3 ) 2 − 4 κ 2 4 κ ( m − 3 ) − m − 3 κ = 2 ( m − 3 ) 2 + 2 ( m − 3 ) 4 κ 2 + ( m − 3 ) 2 4 κ ( m − 3 ) − m − 3 κ = ( m − 3 ) + 4 κ 2 + ( m − 3 ) 2 2 κ − 2 ( m − 3 ) 2 κ = − ( m − 3 ) + 4 κ 2 + ( m − 3 ) 2 2 κ ∈ ( 0 , 1 ) 1 − b 0 1 + b 0 = m − 3 + 2 κ − 4 κ 2 + ( m − 3 ) 2 m − 3 − 2 κ + 4 κ 2 + ( m − 3 ) 2 = [ m − 3 + 2 κ − 4 κ 2 + ( m − 3 ) 2 ] [ ( m − 3 − 2 κ ) − 4 κ 2 + ( m − 3 ) 2 ] [ ( m − 3 − 2 κ ) + 4 κ 2 + ( m − 3 ) 2 ] [ ( m − 3 − 2 κ ) − 4 κ 2 + ( m − 3 ) 2 ] = [ ( m − 3 − 4 κ 2 + ( m − 3 ) 2 ) + 2 κ ] [ ( m − 3 − 4 κ 2 + ( m − 3 ) 2 ) − 2 κ ] ( m − 3 − 2 κ ) 2 − [ 4 κ 2 + ( m − 3 ) 2 ] = ( m − 3 − 4 κ 2 + ( m − 3 ) 2 ) 2 − 4 κ 2 [ ( m − 3 ) 2 + 4 κ 2 ] − 4 κ ( m − 3 ) − [ 4 κ 2 + ( m − 3 ) 2 ] = ( m − 3 ) 2 + 4 κ 2 + ( m − 3 ) 2 − 2 ( m − 3 ) 4 κ 2 + ( m − 3 ) 2 − 4 κ 2 − 4 κ ( m − 3 ) = 2 ( m − 3 ) 2 − 2 ( m − 3 ) 4 κ 2 + ( m − 3 ) 2 − 4 κ ( m − 3 ) = − ( m − 3 ) + 4 κ 2 + ( m − 3 ) 2 2 κ = x 0 \begin{aligned} 1 + b_0 &= 1 + \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 -2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + \sqrt{4\kappa^2+(m-3)^2} -2\kappa}{m-3} \\ 1 - b_0 &= 1 - \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ x_0 &= \frac{1+b_0}{1-b_0} - \frac{m-3}{\kappa} \\ &= \frac{m-3 - 2\kappa + \sqrt{4\kappa^2+(m-3)^2}}{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}} - \frac{m-3}{\kappa} \\ &= \frac{ (m-3 + \sqrt{4\kappa^2+(m-3)^2} - 2\kappa) (m-3 + \sqrt{4\kappa^2+(m-3)^2} + 2\kappa) }{(m-3 + 2\kappa)^2 - (4\kappa^2+(m-3)^2)} - \frac{m-3}{\kappa} \\ &= \frac{(m-3 + \sqrt{4\kappa^2+(m-3)^2})^2 - 4\kappa^2}{ (m-3)^2 + 4\kappa^2 + 4\kappa(m-3) - (4\kappa^2+(m-3)^2) } - \frac{m-3}{\kappa} \\ &= \frac{ (m-3)^2 + 4\kappa^2+(m-3)^2 + 2(m-3)\sqrt{4\kappa^2+(m-3)^2} - 4\kappa^2 }{4\kappa(m-3)} - \frac{m-3}{\kappa} \\ &= \frac{2(m-3)^2 + 2(m-3)\sqrt{4\kappa^2+(m-3)^2}}{4\kappa(m-3)} - \frac{m-3}{\kappa} \\ &= \frac{(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} - \frac{2(m-3)}{2\kappa} \\ &= \frac{-(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} \in(0,1) \\ \frac{1-b_0}{1+b_0} =& \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3 - 2\kappa + \sqrt{4\kappa^2+(m-3)^2}} \\ =& \frac{ [m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}][(m-3 - 2\kappa) - \sqrt{4\kappa^2+(m-3)^2}] }{ [(m-3 - 2\kappa) + \sqrt{4\kappa^2+(m-3)^2}][(m-3 - 2\kappa) - \sqrt{4\kappa^2+(m-3)^2}] } \\ =& \frac{ [(m-3 - \sqrt{4\kappa^2+(m-3)^2}) + 2\kappa ][(m-3 - \sqrt{4\kappa^2+(m-3)^2}) - 2\kappa] }{ (m-3 - 2\kappa)^2 - [4\kappa^2+(m-3)^2] } \\ =& \frac{ (m-3 - \sqrt{4\kappa^2+(m-3)^2})^2 - 4\kappa^2 }{ [(m-3)^2 + 4\kappa^2] - 4\kappa(m-3) - [4\kappa^2+(m-3)^2] } \\ =& \frac{ (m-3)^2 + 4\kappa^2+(m-3)^2 - 2(m-3)\sqrt{4\kappa^2+(m-3)^2} - 4\kappa^2 }{ -4\kappa(m-3) } \\ =& \frac{2(m-3)^2 - 2(m-3)\sqrt{4\kappa^2+(m-3)^2}}{-4\kappa(m-3)} \\ =& \frac{-(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} = x_0 \end{aligned} 1+b01−b0x01+b01−b0========1+m−3−2κ+4κ2+(m−3)2=m−3m−3−2κ+4κ2+(m−3)2=m−3m−3+4κ2+(m−3)2−2κ=1−m−3−2κ+4κ2+(m−3)2=m−3m−3+2κ−4κ2+(m−3)2=m−3m−3+2κ−4κ2+(m−3)2=1−b01+b0−κm−3=m−3+2κ−4κ2+(m−3)2m−3−2κ+4κ2+(m−3)2−κm−3=(m−3+2κ)2−(4κ2+(m−3)2)(m−3+4κ2+(m−3)2−2κ)(m−3+4κ2+(m−3)2+2κ)−κm−3=(m−3)2+4κ2+4κ(m−3)−(4κ2+(m−3)2)(m−3+4κ2+(m−3)2)2−4κ2−κm−3=4κ(m−3)(m−3)2+4κ2+(m−3)2+2(m−3)4κ2+(m−3)2−4κ2−κm−3=4κ(m−3)2(m−3)2+2(m−3)4κ2+(m−3)2−κm−3=2κ(m−3)+4κ2+(m−3)2−2κ2(m−3)=2κ−(m−3)+4κ2+(m−3)2∈(0,1)m−3−2κ+4κ2+(m−3)2m−3+2κ−4κ2+(m−3)2[(m−3−2κ)+4κ2+(m−3)2][(m−3−2κ)−4κ2+(m−3)2][m−3+2κ−4κ2+(m−3)2][(m−3−2κ)−4κ2+(m−3)2](m−3−2κ)2−[4κ2+(m−3)2][(m−3−4κ2+(m−3)2)+2κ][(m−3−4κ2+(m−3)2)−2κ][(m−3)2+4κ2]−4κ(m−3)−[4κ2+(m−3)2](m−3−4κ2+(m−3)2)2−4κ2−4κ(m−3)(m−3)2+4κ2+(m−3)2−2(m−3)4κ2+(m−3)2−4κ2−4κ(m−3)2(m−3)2−2(m−3)4κ2+(m−3)22κ−(m−3)+4κ2+(m−3)2=x0 采样一个 u ∼ U n i f o r m ( 0 , 1 ) u \sim Uniform(0,1) u∼Uniform(0,1), y ∼ B e ( m − 1 2 , m − 1 2 ) ⇒ x = 1 − ( 1 + b 0 ) y 1 − ( 1 − b 0 ) y ∼ e ( x , b 0 ) y \sim Be(\frac{m-1}{2},\frac{m-1}{2}) \Rightarrow x = \frac{1-(1+b_0)y}{1-(1-b_0)y} \sim e(x,b_0) y∼Be(2m−1,2m−1)⇒x=1−(1−b0)y1−(1+b0)y∼e(x,b0) 当 u < f r a d i a l ( x ; κ , m ) M ∗ e ( x , b 0 ) u \lt \frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)} u<M∗e(x,b0)fradial(x;κ,m) 时, 接受 x x x 为样本. f r a d i a l ( x ; κ , m ) M ∗ e ( x , b 0 ) = f r a d i a l ( x ; κ , m ) M f ( 1 − x ( 1 + b 0 ) − ( 1 − b 0 ) x ; m − 1 2 , m − 1 2 ) = ( κ / 2 ) ν Γ ( 1 2 ) Γ ( ν + 1 2 ) I ν ( κ ) B ( m − 1 2 , m − 1 2 ) b 0 m − 3 2 [ ( 1 + b 0 ) − ( 1 − b 0 ) x ] m − 3 e x p ( κ x ) / M = [ ( 1 + b 0 ) − ( 1 − b 0 ) x ] m − 3 e x p ( κ x ) [ ( 1 + b 0 ) − ( 1 − b 0 ) x 0 ] m − 3 e x p ( κ x 0 ) = ( ( 1 + b 0 ) − ( 1 − b 0 ) x ( 1 + b 0 ) − ( 1 − b 0 ) x 0 ) m − 3 e x p ( κ ( x − x 0 ) ) l o g f r a d i a l ( x ; κ , m ) M ∗ e ( x , b 0 ) = ( m − 3 ) l o g ( ( 1 + b 0 ) − ( 1 − b 0 ) x ( 1 + b 0 ) − ( 1 − b 0 ) x 0 ) + κ ( x − x 0 ) = ( m − 3 ) l o g ( 1 − 1 − b 0 1 + b 0 x 1 − 1 − b 0 1 + b 0 x 0 ) + κ ( x − x 0 ) = ( m − 3 ) l o g ( 1 − x 0 x 1 − x 0 2 ) + κ ( x − x 0 ) = ( m − 3 ) l o g ( 1 − x 0 x ) − ( m − 3 ) l o g ( 1 − x 0 2 ) + κ ( x − x 0 ) = κ x + ( m − 3 ) l o g ( 1 − x 0 x ) − [ κ x 0 + ( m − 3 ) l o g ( 1 − x 0 2 ) ] = κ x + ( m − 3 ) l o g ( 1 − x 0 x ) − c \begin{aligned} \frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)} &= \frac{f_{radial}(x;\kappa,m)}{Mf(\frac{1-x}{(1+b_0)-(1-b_0)x}; \frac{m-1}{2}, \frac{m-1}{2})} \\ &= \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} \frac{\Beta(\frac{m-1}{2},\frac{m-1}{2})}{b_0^{\frac{m-3}{2}}} [(1+b_0)-(1-b_0)x]^{m-3} exp(\kappa x) / M \\ &= \frac{[(1+b_0)-(1-b_0)x]^{m-3} exp(\kappa x)}{[(1+b_0)-(1-b_0)x_0]^{m-3} exp(\kappa x_0)} \\ &= \left(\frac{(1+b_0)-(1-b_0)x}{(1+b_0)-(1-b_0)x_0}\right)^{m-3} exp(\kappa (x - x_0)) \\ log\frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)} &= (m-3) log\left(\frac{(1+b_0)-(1-b_0)x}{(1+b_0)-(1-b_0)x_0}\right) + \kappa (x - x_0) \\ &= (m-3) log\left(\frac{1-\frac{1-b_0}{1+b_0}x}{1-\frac{1-b_0}{1+b_0}x_0}\right) + \kappa (x - x_0) \\ &= (m-3) log\left(\frac{1-x_0x}{1-x_0^2}\right) + \kappa (x - x_0) \\ &= (m-3)log(1-x_0x) - (m-3)log(1-x_0^2) + \kappa (x - x_0) \\ &= \kappa x + (m-3)log(1-x_0x) - [\kappa x_0 + (m-3)log(1-x_0^2)] \\ &= \kappa x + (m-3)log(1-x_0x) - c \end{aligned} M∗e(x,b0)fradial(x;κ,m)logM∗e(x,b0)fradial(x;κ,m)=Mf((1+b0)−(1−b0)x1−x;2m−1,2m−1)fradial(x;κ,m)=Γ(21)Γ(ν+21)Iν(κ)(κ/2)νb02m−3B(2m−1,2m−1)[(1+b0)−(1−b0)x]m−3exp(κx)/M=[(1+b0)−(1−b0)x0]m−3exp(κx0)[(1+b0)−(1−b0)x]m−3exp(κx)=((1+b0)−(1−b0)x0(1+b0)−(1−b0)x)m−3exp(κ(x−x0))=(m−3)log((1+b0)−(1−b0)x0(1+b0)−(1−b0)x)+κ(x−x0)=(m−3)log(1−1+b01−b0x01−1+b01−b0x)+κ(x−x0)=(m−3)log(1−x021−x0x)+κ(x−x0)=(m−3)log(1−x0x)−(m−3)log(1−x02)+κ(x−x0)=κx+(m−3)log(1−x0x)−[κx0+(m−3)log(1−x02)]=κx+(m−3)log(1−x0x)−c 即, 当 l o g u < κ x + ( m − 3 ) l o g ( 1 − x 0 x ) − c logu < \kappa x + (m-3)log(1-x_0x) - c logu<κx+(m−3)log(1−x0x)−c 时接受样本 x x x. 与 Communications in Statistics - Simulation and Computation 中的判别公式一致了(除了 ( m − 3 ) (m-3) (m−3) 和 ( m − 1 ) (m-1) (m−1)):
但是与代码中的公式(来源于[1]) 不一致, 且Communications in Statistics - Simulation and Computation 声称
谁对谁错?
怎么办? 到底谁对谁错? 那就把函数图像画出来看一看, 图像在 desmos 平台画出, 这里是我画的图, 可点击查看, 也可以自己调整参数以观察图像变化.
在 m m m 比较大的时候, b 0 = − 2 κ + 4 κ 2 + ( m − 1 ) 2 m − 1 b_0 = \frac{-2\kappa+\sqrt{4\kappa^2+(m-1)^2}}{m-1} b0=m−1−2κ+4κ2+(m−1)2 或是 b 0 = − 2 κ + 4 κ 2 + ( m − 3 ) 2 m − 3 b_0 = \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} b0=m−3−2κ+4κ2+(m−3)2 差别不是很大, 暂且假设 m = 30 ⇒ ν = m 2 − 1 = 14 m=30 \Rightarrow \nu=\frac{m}{2}-1=14 m=30⇒ν=2m−1=14
参考文献
[1] Computer Generation of Distributions on the m-spher.
[2] Communications in Statistics - Simulation and Computation.