原论文
文章目录
1. \textbf{1. } 1. 定理 4.2 \textbf{4.2} 4.2的内容
1.1. \textbf{1.1. } 1.1. 一些符号
1️⃣一些基础的符号
- 基本符号:
符号 含义 Q Q Q 查询集,此处只考虑一个 Q Q Q并且 Q = { q 1 , q 2 , . . . , q m q } Q{=}\{q_1,q_2,...,q_{m_q}\} Q={q1,q2,...,qmq}(此处假设 m q m_q mq为常数),记其子向量为 q r ∈ Q q_r{∈}Q qr∈Q S S S 目标集,此处假定每个 ∣ S ∣ = m {\mid}S{\mid}{=}m ∣S∣=m(常数), S ∗ S^* S∗与 Q Q Q评分最大(其元素为 x j ∗ ∈ S ∗ x^*_j{∈}S^* xj∗∈S∗),其余都记为 S i S_i Si(其元素为 x i j ∈ S i x_{ij}{∈}S_i xij∈Si) N N N 目标集的集即 D = { S 1 , . . . , S N } D\text{=}\{S_1,...,S_N\} D={S1,...,SN},记其元素为 S i ∈ N S_i{∈}N Si∈N - 相似度集合
符号 含义 s r i {\mathbf{s}}_{ri} sri q r q_r qr与 ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i ∀xij∈Si的精确相似度的集合,即 s r i = { Sim ( q r , x i 1 ) , . . . , Sim ( q r , x i m ) } {\mathbf{s}}_{ri}{=}\{\text{Sim}(q_r,x_{i1}),...,\text{Sim}(q_r,x_{im})\} sri={Sim(qr,xi1),...,Sim(qr,xim)} s ^ r i \hat{\mathbf{s}}_{ri} s^ri q r q_r qr与 ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i ∀xij∈Si的近似相似度的集合,即 s ^ r i = { Sim ^ ( q r , x i 1 ) , . . . , Sim ^ ( q r , x i m ) } \hat{\mathbf{s}}_{ri}{=}\{\hat{\text{Sim}}(q_r,x_{i1}),...,\hat{\text{Sim}}(q_r,x_{im})\} s^ri={Sim^(qr,xi1),...,Sim^(qr,xim)} s r ∗ {\mathbf{s}}_r^* sr∗ q r q_r qr与 ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* ∀xj∗∈S∗的精确相似度的集合,即 s r i = { Sim ( q r , x 1 ∗ ) , . . . , Sim ( q r , x m ∗ ) } {\mathbf{s}}_{ri}{=}\{\text{Sim}(q_r,x_1^*),...,\text{Sim}(q_r,x_m^*)\} sri={Sim(qr,x1∗),...,Sim(qr,xm∗)} s ^ r ∗ \hat{\mathbf{s}}_r^* s^r∗ q r q_r qr与 ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* ∀xj∗∈S∗的近似相似度的集合,即 s ^ r i = { Sim ^ ( q r , x 1 ∗ ) , . . . , Sim ^ ( q r , x m ∗ ) } {\mathbf{\hat{s}}}_{ri}{=}\{\hat{\text{Sim}}(q_r,x_1^*),...,\hat{\text{Sim}}(q_r,x_m^*)\} s^ri={Sim^(qr,x1∗),...,Sim^(qr,xm∗)} - 相似度及其最大值
符号 含义 s r i j s_{rij} srij和 s r i max s_{ri\max} srimax q r q_r qr与 ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i ∀xij∈Si中的 s r i j = Sim ( q r , x i j ) s_{rij}{=}\text{Sim}(q_r,x_{ij}) srij=Sim(qr,xij),其最大值记作 s r i max = max ( s r i ) s_{ri\max}{=}\max({\mathbf{s}}_{ri}) srimax=max(sri)且此时向量记为 x i j ∗ x_{ij}^* xij∗ s ^ r i j \hat{s}_{rij} s^rij和 s ^ r i max \hat{s}_{ri\max} s^rimax q r q_r qr与 ∀ x i j ∈ S i \forall{x_{ij}}{∈}S_i ∀xij∈Si中的 s ^ r i j = Sim ^ ( q r , x i j ) \hat{s}_{rij}{=}\hat{\text{Sim}}(q_r,x_{ij}) s^rij=Sim^(qr,xij),其最大值记作 s ^ r i max = max ( s ^ r i ) \hat{s}_{ri\max}{=}\max(\hat{{\mathbf{s}}}_{ri}) s^rimax=max(s^ri)且此时向量记为 x i j ∗ x_{ij}^* xij∗ s r j ∗ {s}_{rj}^* srj∗和 s r max ∗ s_{r\max}^* srmax∗ q r q_r qr与 ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* ∀xj∗∈S∗中的 s r j ∗ = Sim ( q r , x j ∗ ) {s}_{rj}^*{=}\text{Sim}(q_r,x_j^*) srj∗=Sim(qr,xj∗),其最大值记作 s r max ∗ = max ( s r ∗ ) s_{r\max}^*{=}\max({\mathbf{s}}_r^*) srmax∗=max(sr∗)且此时向量记为 x j ∗ ∗ x_j^{**} xj∗∗ s ^ r j ∗ \hat{s}_{rj}^* s^rj∗和 s ^ r max ∗ \hat{s}_{r\max}^* s^rmax∗ q r q_r qr与 ∀ x j ∗ ∈ S ∗ \forall{}x^*_j{∈}S^* ∀xj∗∈S∗中的 s ^ r j ∗ = Sim ^ ( q r , x j ∗ ) \hat{s}_{rj}^*{=}\hat{\text{Sim}}(q_r,x_j^*) s^rj∗=Sim^(qr,xj∗),其最大值记作 s ^ r max ∗ = max ( s ^ r ∗ ) \hat{s}_{r\max}^*{=}\max({\mathbf{\hat{s}}}_r^*) s^rmax∗=max(s^r∗)且此时向量记为 x j ∗ ∗ x_j^{**} xj∗∗ - 几种聚合:( w r w_r wr为权值)
- 内部聚合:即 σ σ σ或 max \max max(最大值聚合),以 σ \sigma σ为例对不同集合的聚合记作 σ ( s r i ) / σ ( s ^ r i ) / σ ( s r ∗ ) / σ ( s ^ r ∗ ) σ({\mathbf{s}}_{ri})/σ(\hat{\mathbf{s}}_{ri})/σ({\mathbf{s}}_r^*)/σ(\hat{\mathbf{s}}_r^*) σ(sri)/σ(s^ri)/σ(sr∗)/σ(s^r∗)
- 外部聚合:聚合 σ ( s r i ) / σ ( s ^ r i ) / σ ( s r ∗ ) / σ ( s ^ r ∗ ) σ({\mathbf{s}}_{ri})/σ(\hat{\mathbf{s}}_{ri})/σ({\mathbf{s}}_r^*)/σ(\hat{\mathbf{s}}_r^*) σ(sri)/σ(s^ri)/σ(sr∗)/σ(s^r∗)得到评分
- 对 S i S_i Si有: F ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s r i ) F\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{s}}_{ri}) F(Q,Si)=mq1r=1∑mqwrσ(sri)和 F ^ ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) \hat{F}\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri}) F^(Q,Si)=mq1r=1∑mqwrσ(s^ri)
- 对 S ∗ S^* S∗有: F ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s r ∗ ) {F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{s}}_r^*) F(Q,S∗)=mq1r=1∑mqwrσ(sr∗)和 F ^ ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) \hat{F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*) F^(Q,S∗)=mq1r=1∑mqwrσ(s^r∗)
2️⃣定理参数与结论
- 界限参数:对于 0 < β ≤ 1 ≤ α 0\text{<}β\text{≤}1\text{≤}α 0<β≤1≤α
符号 含义 F ( Q , S ∗ ) F(Q, S^*) F(Q,S∗)的下界 B ∗ B^* B∗ B ∗ = β m q ∑ r = 1 m q w r s r max ∗ B^*\text{=}\displaystyle{}\frac{β}{m_q}\sum_{r=1}^{m_q}w_rs_{r\max}^* B∗=mqβr=1∑mqwrsrmax∗即 S ∗ S^* S∗的保守估计 F ( Q , S i ) F(Q, S_i) F(Q,Si)的上界 B i B_i Bi B i = α m q ∑ r = 1 m q w r s ^ r i max B_i\text{=}\displaystyle{}\fracα{m_q}\sum_{r=1}^{m_q}w_r\hat{s}_{ri\max} Bi=mqαr=1∑mqwrs^rimax即 S i S_i Si的乐观估计, S ∗ ∉ { S i } S^*{\notin}\{S_i\} S∗∈/{Si}时 B i B_i Bi最大值为 B i max B_{i\max} Bimax,及 Δ = B ∗ – B i max 3 \Delta{\text{=}}\cfrac{B^*–B_{i\max}}{3} Δ=3B∗–Bimax - 其它参数:(有些是证明过程中的)
符号 含义 失败概率 δ δ δ 算法的失败概率,目标是以至少 1 − δ 1{-}δ 1−δ的概率正确返回 S ∗ S^* S∗ 哈希数量 L L L DESSERT \text{DESSERT} DESSERT中对每个 q r ∈ Q q_r{∈}Q qr∈Q和 x i j ∈ S i x_{ij}{∈}S_i xij∈Si进行 L L L次分桶,此处设为 L = O ( log ( N m q m δ ) ) L\text{=}\displaystyle{}O\left({\log\left(\frac{N{m}_{q}m}{δ}\right)}\right) L=O(log(δNmqm)) 上界 γ r i γ_{ri} γri 关于 Δ i r / s r i max / τ i r \Delta_{ir}/s_{ri\max}/\tau_{ir} Δir/srimax/τir的函数( τ r i = α s r i max + Δ r i \tau_{ri}{=}αs_{ri\max}{+}\Delta_{ri} τri=αsrimax+Δri),当 Δ r i \Delta_{ri} Δri固定时最大值 ( γ r i ) max ∈ ( 1 − Δ r i α , 1 ) (γ_{ri})_{\max}{∈}\left(1{-}\cfrac{\Delta_{ri}}{α},1\right) (γri)max∈(1−αΔri,1) 指示随机 1 \mathbb{1} 1 例如事件 A A A发生了则有 1 A = 1 \mathbb{1}_A{=}1 1A=1,而本文中 1 = 1 \mathbb{1}{=}1 1=1表示所有上界和下界条件同时满足 1.2. \textbf{1.2. } 1.2. 定理内容
1️⃣定理结论:设定 Δ > 0 \Delta\text{>}0 Δ>0
- 第一种表述: Pr [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] ≥ 1 − δ \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right]{≥}1{-}δ Pr[∀i(F^(Q,S∗)>F^(Q,Si))]≥1−δ
- 第一种表述: DESSERT \text{DESSERT} DESSERT算法结构能以 1 − δ 1{-}δ 1−δ的概率,返回与 Q Q Q相似度最高的 S ∗ = argmax i ∈ { 1 , … , N } F ( Q , S i ) S^*\text{=}\mathop{\operatorname{argmax}}\limits_{{i{∈}\{1,\ldots,N\}}}F\left( {Q,S_{i}}\right) S∗=i∈{1,…,N}argmaxF(Q,Si)
2️⃣证明思路:要证 Pr [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] ≥ 1 − δ \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right]{≥}1{-}δ Pr[∀i(F^(Q,S∗)>F^(Q,Si))]≥1−δ
- 总体思路:找到一个 L L L满足
- 上界控制:对于所有 S i ≠ S ∗ S_i{≠}S^* Si=S∗,确保其估计得分 F ^ ( Q , S i ) \hat{F}(Q,S_i) F^(Q,Si)不超过某个阈值
- 下界控制:对于 S ∗ S^* S∗,确保其估计得分 F ^ ( Q , S ∗ ) \hat{F}(Q,S^*) F^(Q,S∗)不低于某个阈值
- 联合界限:上述条件同时以高概率成立,从而保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S∗)>F^(Q,Si)
- 上下界限:当 L = max { ln ( δ 2 ( N − 1 ) m q m ) ln ( ( γ r i ) max ) , β 2 ln ( 4 m q δ ) 2 Δ r i 2 } L{=}\max\left\{\cfrac{\ln\left(\cfrac{δ}{2(N{-}1)m_qm}\right)}{\ln{\left((γ_{ri})_{\max}\right)}},\cfrac{β^2\ln\left(\cfrac{4m_q}{\delta}\right)}{2\Delta_{ri}^2}\right\} L=max⎩ ⎨ ⎧ln((γri)max)ln(2(N−1)mqmδ),2Δri2β2ln(δ4mq)⎭ ⎬ ⎫时
- 上界: S i ≠ S ∗ S_i{≠}S^* Si=S∗中共 ( N − 1 ) m q (N{-}1)m_q (N−1)mq个 q r q_r qr,有 Pr [ ∀ q r ( σ ( s ^ r i ) ≥ α s r i max + Δ r i ) ] ≤ δ 2 \Pr\left[\forall{q_r}\left({σ(\hat{\mathbf{s}}_{ri}){≥}α s_{ri\max}{+}\Delta_{ri}}\right)\right]{≤}\cfrac{δ}{2} Pr[∀qr(σ(s^ri)≥αsrimax+Δri)]≤2δ即 σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)高概率在上界 α s r i max + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri下
- 下界: S ∗ S^* S∗中共 m q m_q mq个 q r q_r qr,有 Pr [ ∀ q r ( σ ( s ^ r ∗ ) ≤ β s r max ∗ − Δ r i ) ] ≤ δ 2 \Pr\left[\forall{q_r}\left({σ(\hat{\mathbf{s}}_r^*){≤}βs_{r\max}^*{-}\Delta_{ri}}\right)\right]{≤}\cfrac{δ}{2} Pr[∀qr(σ(s^r∗)≤βsrmax∗−Δri)]≤2δ即 σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r∗)高概率在下界 β s r max ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmax∗−Δri上
- 联合界限:保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S∗)>F^(Q,Si)高概率成立
- 假定: 1 \mathbb{1} 1为一个二元指示,当 1 = 1 \mathbb{1}{=}1 1=1时表示上述 ( N − 1 ) m q (N{-}1)m_q (N−1)mq个上界和 m q m_q mq个下界同时成立
- 上界:对所有 S i ≠ S ∗ S_i{≠}S^* Si=S∗中共 ( N − 1 ) m q (N{-}1)m_q (N−1)mq个 q r q_r qr,有 σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)都在上界 α s r i max + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri下
- 下界:所有 S ∗ S^* S∗中共 m q m_q mq个 q r q_r qr,有 σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r∗)都在下界 β s r max ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmax∗−Δri上
- 思路:先证明蕴含关系即 1 = 1 \mathbb{1}{=}1 1=1时事件 ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) \forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right) ∀i(F^(Q,S∗)>F^(Q,Si))成立,再证明 Pr ( 1 = 1 ) = 1 − δ \Pr(\mathbb{1}{=}1){=}1{-}\delta Pr(1=1)=1−δ
3. \textbf{3. } 3. 联合界限
0️⃣基本思路:保证 F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) \hat{F}(Q,S^*){>}\hat{F}(Q,S_i) F^(Q,S∗)>F^(Q,Si)高概率成立
- 假定: 1 \mathbb{1} 1为一个二元指示,当 1 = 1 \mathbb{1}{=}1 1=1时表示 ( N − 1 ) m q (N{-}1)m_q (N−1)mq个上界和 m q m_q mq个下界同时成立
- 上界:对所有 S i ≠ S ∗ S_i{≠}S^* Si=S∗中共 ( N − 1 ) m q (N{-}1)m_q (N−1)mq个 q r q_r qr,有 σ ( s ^ r i ) σ(\hat{\mathbf{s}}_{ri}) σ(s^ri)都在上界 α s r i max + Δ r i αs_{ri\max}{+}\Delta_{ri} αsrimax+Δri下
- 下界:所有 S ∗ S^* S∗中共 m q m_q mq个 q r q_r qr,有 σ ( s ^ r ∗ ) σ(\hat{\mathbf{s}}_r^*) σ(s^r∗)都在下界 β s r max ∗ − Δ r i βs_{r\max}^*{-}\Delta_{ri} βsrmax∗−Δri上
- 思路:先证明蕴含关系即 1 = 1 \mathbb{1}{=}1 1=1时事件 ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) \forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right) ∀i(F^(Q,S∗)>F^(Q,Si))成立,再证明 Pr ( 1 = 1 ) ≥ 1 − δ \Pr(\mathbb{1}{=}1){≥}1{-}\delta Pr(1=1)≥1−δ
1️⃣蕴含关系的证明:对 Pr [ ∀ i ( F ^ ( Q , S ∗ ) > F ^ ( Q , S i ) ) ] \Pr\left[\forall{i}\left(\hat{F}(Q,S^*){>}\hat{F}(Q,S_i)\right)\right] Pr[∀i(F^(Q,S∗)>F^(Q,Si))]的不断进行变换
- 由定义 F ^ ( Q , S i ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) \hat{F}\left({Q,S_i}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri}) F^(Q,Si)=mq1r=1∑mqwrσ(s^ri)和 F ^ ( Q , S ∗ ) = 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) \hat{F}\left({Q,S^*}\right)\text{=}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*) F^(Q,S∗)=mq1r=1∑mqwrσ(s^r∗)
- 代入得,原式 = Pr [ ∀ i ( F ^ ( Q , S ∗ ) − F ^ ( Q , S i ) > 0 ) ] = Pr [ ∀ i ( ( 1 m q ∑ r = 1 m q w r σ ( s ^ r ∗ ) − 1 m q ∑ r = 1 m q w r σ ( s ^ r i ) ) > 0 ) ] {=}\Pr\left[\forall{i}\left(\hat{F}(Q,S^*){-}\hat{F}(Q,S_i){>}0\right)\right]{=}\Pr\left[\forall{i}\left(\left(\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ(\hat{\mathbf{s}}_r^*){-}\displaystyle{}\frac{1}{m_q}\sum_{r=1}^{m_q}w_rσ({\mathbf{\hat{s}}}_{ri})\right){>}0\right)\right] =Pr[∀i(F^(Q,S∗)−F^(Q,Si)>0)]=Pr[∀i((mq1r=1∑mqwrσ(s^r∗)−mq1r=1∑mqwrσ(s^ri))>0)]
- 化简得,原式 = Pr [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 ) ] {=}\Pr\left[\forall{i}\left(\displaystyle{}\sum_{r=1}^{m_q}w_r\left(σ(\hat{\mathbf{s}}_r^*){-}σ({\mathbf{\hat{s}}}_{ri})\right){>}0\right)\right] =Pr[∀i(r=1∑mqwr(σ(s^r∗)−σ(s^ri))>0)]
- 考虑有 Pr ( A ) ≥ Pr ( A ∩ B ) = Pr ( A ∣ B ) Pr ( B ) \Pr(A){≥}\Pr(A{∩}B){=}\Pr(A|B)\Pr(B) Pr(A)≥Pr(A∩B)=Pr(A∣B)Pr(B),所以原式 ≥ Pr [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 | 1 = 1 ) ] Pr [ 1 = 1 ] {≥}\displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(\sigma(\hat{\mathbf{s}}_r^*){-}\sigma(\hat{\mathbf{s}}_{ri}) \right){>}0\middle|\mathbb{1}{=}1\right)\right]\Pr\left[\mathbb{1}{=}1\right] ≥Pr[∀i(r=1∑mqwr(σ(s^r∗)−σ(s^ri))>0 1=1)]Pr[1=1]
- 当 1 = 1 \mathbb{1}{=}1 1=1时有 σ ( s ^ r i ) ≤ α s r i max + Δ r i σ(\hat{\mathbf{s}}_{ri}){≤}αs_{ri\max}{+}\Delta_{ri} σ(s^ri)≤αsrimax+Δri以及 σ ( s ^ r ∗ ) ≥ β s r max ∗ − Δ r i σ(\hat{\mathbf{s}}_r^*){≥}βs_{r\max}^*{-}\Delta_{ri} σ(s^r∗)≥βsrmax∗−Δri,所以 σ ( s ^ r ∗ ) − σ ( s ^ r i ) ≥ β s r max ∗ − α s r i max − 2 Δ r i σ(\hat{\mathbf{s}}_r^*){-}σ(\hat{\mathbf{s}}_{ri}){≥}βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri} σ(s^r∗)−σ(s^ri)≥βsrmax∗−αsrimax−2Δri
- 故 β s r max ∗ − α s r i max − 2 Δ r i > 0 βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}{>}0 βsrmax∗−αsrimax−2Δri>0发生时, σ ( s ^ r ∗ ) − σ ( s ^ r i ) > 0 σ(\hat{\mathbf{s}}_r^*){-}σ(\hat{\mathbf{s}}_{ri}){>}0 σ(s^r∗)−σ(s^ri)>0必发生,即 β s r max ∗ − α s r i max − 2 Δ r i > 0 βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}{>}0 βsrmax∗−αsrimax−2Δri>0事件概率更小
- 故 Pr [ ∀ i ( ∑ r = 1 m q w r ( σ ( s ^ r ∗ ) − σ ( s ^ r i ) ) > 0 | 1 = 1 ) ] ≥ Pr [ ∀ i ( ∑ r = 1 m q w r ( β s r max ∗ − α s r i max − 2 Δ r i ) > 0 ) ] \displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(\sigma(\hat{\mathbf{s}}_r^*){-}\sigma(\hat{\mathbf{s}}_{ri}) \right){>}0\middle|\mathbb{1}{=}1\right)\right]{≥}\displaystyle\Pr\left[\forall{i}\left(\sum_{r=1}^{m_q}w_r \left(βs_{r\max}^*{-}αs_{ri\max}{-}2\Delta_{ri}\right){>}0\right)\right] Pr[∀i(r=1∑mqwr(σ(s^r∗)−σ(s^ri))>0 1=1)]≥Pr[∀i(r=1∑mqwr(βsrmax∗−αsrimax−2Δri)>0)]
- 稍作变换,原式 ≥ Pr [ ∀ i ( ∑ r = 1 m q w r ( β s r max ∗ − α s r i max ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ( 1 = 1 ) {≥}\displaystyle\Pr\left[{{\forall }{i}\left({\sum_{{r=1}}^{{m}_{q}}{w}_{r}\left({βs_{r\max}^*{-}\alpha s_{ri\max}}\right){>}{2\Delta_{ri}}\sum_{{r = 1}}^{{m}_{q}}{w}_{r}}\right)}\right]\Pr(\mathbb{1}{=}1) ≥Pr[∀i(r=1∑mqwr(βsrmax∗−αsrimax)>2Δrir=1∑mqwr)]Pr(1=1)
- 由定义 B ∗ = β m q ∑ r = 1 m q w r s r max ∗ B^*\text{=}\displaystyle{}\frac{β}{m_q}\sum_{r=1}^{m_q}w_rs_{r\max}^* B∗=mqβr=1∑mqwrsrmax∗和 B i = α m q ∑ r = 1 m q w r s ^ r i max B_i\text{=}\displaystyle{}\fracα{m_q}\sum_{r=1}^{m_q}w_r\hat{s}_{ri\max} Bi=mqαr=1∑mqwrs^rimax
- 代入得,原式 ≥ Pr [ ∀ i ( m q ( B ∗ − B i ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_i}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r = 1}}^{{m}_{q}}{w}_r}\right) }\right]\Pr({\mathbb{1}{=}1}) ≥Pr[∀i(mq(B∗−Bi)>2Δrir=1∑mqwr)]Pr(1=1)
- 又由于 B i , max > B i B_{i,\max}{>}B_i Bi,max>Bi,即 Pr [ ∀ i ( m q ( B ∗ − B i ) > 2 Δ r i ∑ r = 1 m q w r ) ] ≥ Pr [ ∀ i ( m q ( B ∗ − B i max ) > 2 Δ r i ∑ r = 1 m q w r ) ] \Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_i}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right]{≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_{i\max}}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right] Pr[∀i(mq(B∗−Bi)>2Δrir=1∑mqwr)]≥Pr[∀i(mq(B∗−Bimax)>2Δrir=1∑mqwr)]
- 所以,原式 ≥ Pr [ ∀ i ( m q ( B ∗ − B i max ) > 2 Δ r i ∑ r = 1 m q w r ) ] Pr ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({{m}_{q}\left({B^*{-}B_{i\max}}\right){>}{2\Delta_{ri} }\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right) }\right]\Pr({\mathbb{1}{=}1}) ≥Pr[∀i(mq(B∗−Bimax)>2Δrir=1∑mqwr)]Pr(1=1)
- 定义阈值:让所有的 Δ r i \Delta_{ri} Δri都为固定值,且 Δ = B ∗ – B i max 3 \Delta{=}\cfrac{B^*–B_{i\max}}{3} Δ=3B∗–Bimax
- 所以,原式 ≥ Pr [ ∀ i ( 3 m q Δ > 2 Δ ∑ r = 1 m q w r ) ] Pr ( 1 = 1 ) {≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right)}\right]\Pr({\mathbb{1}{=}1}) ≥Pr[∀i(3mqΔ>2Δr=1∑mqwr)]Pr(1=1)
- 又考虑到 1 ≥ w r 1{≥}{w}_r 1≥wr即 2 m q Δ ≥ 2 Δ ∑ r = 1 m q w r 2m_q\Delta{≥}2\Delta\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r 2mqΔ≥2Δr=1∑mqwr,所以 Pr [ ∀ i ( 3 m q Δ > 2 Δ ∑ r = 1 m q w r ) ] ≥ Pr [ ∀ i ( 3 m q Δ > 2 m q Δ ) ] \Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}\displaystyle\sum_{{r=1}}^{{m}_{q}}{w}_r}\right)}\right]{≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}2m_q\Delta}\right)}\right] Pr[∀i(3mqΔ>2Δr=1∑mqwr)]≥Pr[∀i(3mqΔ>2mqΔ)]
- 所以原式 ≥ Pr [ ∀ i ( 3 m q Δ > 2 Δ ) ] Pr ( 1 = 1 ) = Pr ( 1 = 1 ) = 1 − Pr ( 1 = 0 ) {≥}\Pr\left[{\forall{i}\left({3{m}_{q}\Delta{>}{2\Delta}}\right)}\right]\Pr({\mathbb{1}{=}1}){=}\Pr({\mathbb{1}{=}1}){=}1{-}\Pr({\mathbb{1}{=}0}) ≥Pr[∀i(3mqΔ>2Δ)]Pr(1=1)=Pr(1=1)=1−Pr(1=0)
2️⃣概率的证明: Pr ( 1 = 1 ) = 1 − δ \Pr(\mathbb{1}{=}1){=}1{-}\delta Pr(1=1)=1−δ
- 试图证明 Pr ( 1 = 0 ) \Pr(\mathbb{1}{=}0) Pr(1=0),并将该失败事件分为
- 至少有一个上界失败,即 U fail = ( ∃ ( r , S i ≠ S ∗ ) ( σ ( s ^ r i ) ≥ α s r i max + Δ r i ) ) U_{\text{fail}}{=}\left({∃}(r,S_i{≠}S^*)\left({σ(\hat{\mathbf{s}}_{ri}){≥}α s_{ri\max}{+}\Delta_{ri}}\right)\right) Ufail=(∃(r,Si=S∗)(σ(s^ri)≥αsrimax+Δri)),已证设定 L L L后 Pr ( U fail ) ≤ δ 2 \Pr\left(U_{\text{fail}}\right){≤}\cfrac{\delta}{2} Pr(Ufail)≤2δ
- 至少有一个下界失败,即 L fail = ( ∃ ( r , S i = S ∗ ) ( σ ( s ^ r ∗ ) ≤ β s r max ∗ − Δ r i ) ) L_{\text{fail}}{=}\left({∃}(r,S_i{=}S^*)\left({σ(\hat{\mathbf{s}}_r^*){≤}βs_{r\max}^*{-}\Delta_{ri}}\right)\right) Lfail=(∃(r,Si=S∗)(σ(s^r∗)≤βsrmax∗−Δri)),已证设定 L L L后 Pr ( L fail ) ≤ δ 2 \Pr\left(L_{\text{fail}}\right){≤}\cfrac{\delta}{2} Pr(Lfail)≤2δ
- 所以 Pr ( 1 = 0 ) ≤ Pr ( U fail ) + Pr ( L fail ) = δ \Pr(\mathbb{1}{=}0){≤}\Pr\left(U_{\text{fail}}\right){+}\Pr\left(L_{\text{fail}}\right){=}\delta Pr(1=0)≤Pr(Ufail)+Pr(Lfail)=δ,即 Pr ( 1 = 1 ) ≥ 1 − δ \Pr(\mathbb{1}{=}1){≥}1{-}\delta Pr(1=1)≥1−δ
- 最后 L = max { ln ( 2 ( N − 1 ) m q m δ ) ln ( 1 ( γ r i ) max ) , β 2 ln ( 4 m q δ ) 2 Δ r i 2 } = max { O ( log ( N m q m δ ) ) , O ( log ( m q δ ) ) } = O ( log ( N m q m δ ) ) \small{}L{=}\max\left\{\cfrac{\ln\left(\cfrac{2(N{-}1)m_qm}{δ}\right)}{\ln{\left(\cfrac{1}{(γ_{ri})_{\max}}\right)}},\cfrac{β^2\ln\left(\cfrac{4m_q}{\delta}\right)}{2\Delta_{ri}^2}\right\}{=}\max\left\{O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right),O\left( {\log \left( \cfrac{{m}_{q}}{\delta }\right) }\right)\right\}{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=max⎩ ⎨ ⎧ln((γri)max1)ln(δ2(N−1)mqm),2Δri2β2ln(δ4mq)⎭ ⎬ ⎫=max{O(log(δNmqm)),O(log(δmq))}=O(log(δNmqm))证毕
Ps. \textbf{Ps. } Ps. 运行时间分析
1️⃣一些假设
- 计算任何一个 LSH \text{LSH} LSH函数 ψ t ( x ) \psi{_t}(x) ψt(x)的时间都为 O ( d ) O(d) O(d),其中 d d d为向量 x x x的维度
- 让 ∣ D [ i ] t , h ∣ < T |\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,h}|\text{<}T ∣D[i]t,h∣<T,即用哈希函数 ψ t \psi_t ψt对集合 S i S_i Si分桶,落入哈希值为 h h h的桶的向量数不超过常数 T T T
- 让哈希数量 L = O ( log ( N m q m δ ) ) L{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=O(log(δNmqm)),于定理中的一致
2️⃣复杂度: O ( m q L d + ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(m_qLd{+}\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O mqLd+qr=q1∑qr=qmqSi=S1∑Si=SNψt=ψ1∑ψt=ψLD[i]t,ψt(qr)
- O ( m q L d ) O\left(m_qLd\right) O(mqLd)表示对查询 Q Q Q的处理,给 m q m_q mq个向量 q r q_r qr每个计算 L L L个哈希值,每个哈希值计算耗时 O ( d ) O(d) O(d),所以为 O ( m q L d ) O\left(m_qLd\right) O(mqLd)
- O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O qr=q1∑qr=qmqSi=S1∑Si=SNψt=ψ1∑ψt=ψLD[i]t,ψt(qr) 表示对 D = { S 1 , S 2 , . . . , S N } D\text{=}\{S_1,S_2,...,S_N\} D={S1,S2,...,SN}的处理
- ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) \displaystyle\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)} ψt=ψ1∑ψt=ψLD[i]t,ψt(qr)表示,对于固定 q r q_r qr和 S i S_i Si,所姚检查的所有桶中的向量的总数,每检查一个向量(与 q r q_r qr碰撞与否)耗时 O ( 1 ) O(1) O(1)
- 对于所有的 q r q_r qr和所有的 S i S_i Si,一共要检查 O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right) O qr=q1∑qr=qmqSi=S1∑Si=SNψt=ψ1∑ψt=ψLD[i]t,ψt(qr) 次
- 考虑到 ∣ D [ i ] t , h ∣ < T |\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,h}|\text{<}T ∣D[i]t,h∣<T所以 O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L D [ i ] t , ψ t ( q r ) ) < O ( ∑ q r = q 1 q r = q m q ∑ S i = S 1 S i = S N ∑ ψ t = ψ 1 ψ t = ψ L T ) = O ( m q N L T ) O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}\mathcal{D}{\left\lbrack{}i\right\rbrack}_{t,\psi_{t}(q_r)}\right)\text{<}O\left(\displaystyle\sum_{q_r=q_1}^{q_r=q_{m_q}}\sum_{S_i=S_1}^{S_i=S_N}\sum_{\psi_t=\psi_1}^{\psi_t=\psi_L}T\right)\text{=}O\left(m_qNLT\right) O qr=q1∑qr=qmqSi=S1∑Si=SNψt=ψ1∑ψt=ψLD[i]t,ψt(qr) <O qr=q1∑qr=qmqSi=S1∑Si=SNψt=ψ1∑ψt=ψLT =O(mqNLT)
- 将 L = O ( log ( N m q m δ ) ) L{=}O\left( {\log \left( \cfrac{N{m}_{q}m}{\delta}\right) }\right) L=O(log(δNmqm))代回
- 最终 O ( m q L d + m q N L T ) = O ( m q L d + m q N L T ) = O ( m q d log ( N m q m δ ) + m q N T log ( N m q m δ ) ) O\left(m_qLd{+}m_qNLT\right){=}O\left(m_qLd{+}m_qNLT\right){=}O\left(m_qd\log \left( \cfrac{N{m}_{q}m}{\delta}\right){+}m_qNT\log \left( \cfrac{N{m}_{q}m}{\delta}\right)\right) O(mqLd+mqNLT)=O(mqLd+mqNLT)=O(mqdlog(δNmqm)+mqNTlog(δNmqm))
- 另外其实还可以忽略常数 T T T